寂静回声 发表于 昨天 11:32

只用一个大模型审代码已经过时

现在,开三个Cursor窗口,分别用Gemini 3.0 Pro、Claude Opus 4.5和Codex 5.1 High Pro,分别审查代码库并生成详尽的Markdown报告。然后让每个模型阅读另外两个的报告,最后用Opus 4.5进行步骤化的统一重构。流程结束,代码质量显著提升。
为什么不用单一最强的Codex 5.1?即使是“王者”也需要智囊团。不同模型视角互补,避免盲点,提升审查深度。过往“凭感觉写代码”的时代一去不复返,生成式AI协作正成为软件进化的核心动力。

虽然有人担心多模型审查会带来冲突和额外复杂度,实际操作中可以根据目标选用最适合的模型:
- Opus 4.5:通用且擅长理解新代码库
- Gemini 3.0:前端和UI表现卓越
- Codex 5.1:后端逻辑推理无敌
批判性的多模型交叉验证,相当于三位资深工程师各抒己见,最终汇聚成最佳方案。人类设计流程和决策策略,才是发挥这些AI最大效能的关键。
这不仅仅是工具升级,更是开发范式的变革。未来,单模型“孤军奋战”将被多模型“团队协作”取代,代码审查和重构将更加严谨、高效、可靠。我们不再是“单兵作战”,而是运营一个由智能体组成的开发团队。
原文:x.com/vasuman/status/1996414648594161923

点评
按照这篇文章的观点,大模型用于机械设计,那真是遥遥无期,因为现在大模型正常的阅读理解力非常操蛋。
大模型直接无视伺服电机前的伺服二字
http://jixietop.top/forum.php?mod=viewthread&tid=67542&fromuid=779
这提问中明明提到伺服电机,大模型ai就从来没想到伺服电机的选型重点是什么。就把它当成普通的异步电机,巴拉巴拉说了一堆废话。

5个大模型都那个傻样,如果5个大模型全上的话,这一天到晚都不用干别的了,光写提示词时间忙了一天。
https://s3.bmp.ovh/imgs/2025/12/15/12b1466eed3a2168.jpg

页: [1]
查看完整版本: 只用一个大模型审代码已经过时