程序员不慌,大模型写代码依然“死记硬背”
谢赛宁推出测试集,o3、Gemini-2.5-pro、Claude-3.7、DeepSeek-R1一众模型,hard级别全都0分。LLM在难题上表现很差,其解题能力依然是“死记硬背”,依赖工具,并非真正的逻辑推理。
谢赛宁推出测试集,o3、Gemini-2.5-pro、Claude-3.7、DeepSeek-R1一众模型,hard级别全都0分。LLM在难题上表现很差,其解题能力依然是“死记硬背”,依赖工具,并非真正的逻辑推理。
近日,第十二届全国高校电工电子基础课程实验教学案例设计竞赛在哈尔滨举行。经过华东赛区初选、全国复赛的激烈角逐,南京邮电大学工程实验教学部胡馨元团队“智能电子花”实验教学案例、陈蓉团队“基于FPGA的手势识别系统设计”实验教学案例在综合评比中表现优异,分获全国一