只用一个大模型审代码已经过时

寂静回声 发表于 2025-12-15 11:32:05

现在，开三个Cursor窗口，分别用Gemini 3.0 Pro、Claude Opus 4.5和Codex 5.1 High Pro，分别审查代码库并生成详尽的Markdown报告。然后让每个模型阅读另外两个的报告，最后用Opus 4.5进行步骤化的统一重构。流程结束，代码质量显著提升。
为什么不用单一最强的Codex 5.1？即使是“王者”也需要智囊团。不同模型视角互补，避免盲点，提升审查深度。过往“凭感觉写代码”的时代一去不复返，生成式AI协作正成为软件进化的核心动力。

虽然有人担心多模型审查会带来冲突和额外复杂度，实际操作中可以根据目标选用最适合的模型：
- Opus 4.5：通用且擅长理解新代码库
- Gemini 3.0：前端和UI表现卓越
- Codex 5.1：后端逻辑推理无敌
批判性的多模型交叉验证，相当于三位资深工程师各抒己见，最终汇聚成最佳方案。人类设计流程和决策策略，才是发挥这些AI最大效能的关键。
这不仅仅是工具升级，更是开发范式的变革。未来，单模型“孤军奋战”将被多模型“团队协作”取代，代码审查和重构将更加严谨、高效、可靠。我们不再是“单兵作战”，而是运营一个由智能体组成的开发团队。
原文：x.com/vasuman/status/1996414648594161923

点评
按照这篇文章的观点，大模型用于机械设计，那真是遥遥无期，因为现在大模型正常的阅读理解力非常操蛋。
大模型直接无视伺服电机前的伺服二字
http://jixietop.top/forum.php?mod=viewthread&tid=67542&fromuid=779
这提问中明明提到伺服电机，大模型ai就从来没想到伺服电机的选型重点是什么。就把它当成普通的异步电机，巴拉巴拉说了一堆废话。

5个大模型都那个傻样，如果5个大模型全上的话，这一天到晚都不用干别的了，光写提示词时间忙了一天。
https://s3.bmp.ovh/imgs/2025/12/15/12b1466eed3a2168.jpg

页: [1]

机械荟萃山庄's Archiver

只用一个大模型审代码已经过时