网站地图官方微信:
网站首页 洪集镇 琅琚镇 霞峰镇 稻田镇 喜古乡 黄坪镇

当前位置: 首页 >

林俊旸从阿里离职后首发长文:复盘千问路线受阻,断言AI演进全面转向智能体_思考_模型_推理

3月27日,前阿里千问技术负责人林俊旸离职后发表长文,明确指出 AI 大模型的发展路线正在经历重大跨越,核心竞争焦点正从“推理型思考(Reasoning Thinking)”全面转向“智能体思考(Agentic Thinking)”。

文章复盘了以 OpenAI o1 和 DeepSeek-R1 为代表的第一***理模型浪潮,指出这标志着行业从扩大预训练规模,正式步入扩大强化学习(RL)后训练规模的新阶段,数学与代码等可验证领域成为优化模型正确性的核心试金石。

林俊旸在文中深度剖析了行业内尝试“融合思考与指令模式”所面临的落地困境。他透露,千问团队曾试图通过 Qwen3 打造支持混合思考模式的系统,但在实际推进中发现,指令模型追求极简与低延迟,而思考模型需要消耗大量 Token 进行复杂推演,两者在数据分布和行为目标上存在根本冲突。若数据筛选不当,强行融合往往会导致模型在两端表现平庸。基于商业客户对高吞吐量和低成本的真实需求,Qwen 在后续的 2507 版本中选择推出了分离的 30B 和 235B 指令与思考变体。与之形成对比的是,Anthropic 和 DeepSeek 等厂商则继续在统合推理与工具调用的混合架构上进行探索。

针对下一阶段的技术演进,林俊旸断言,单纯延长模型内部推理轨迹的时代即将过去,未来的主导将是在与环境交互中持续迭代***的智能体思考。他指出,智能体强化学习(Agentic RL)彻底改变了原有的技术栈要求,训练与推理必须实现更纯粹的解耦。随着大模型获得搜索、代码执行等工具权限,防范奖励***(Reward Hacking)将成为极其危险的挑战。未来的行业护城河将不再局限于算法本身,而是转移至高质量环境设计、防***协议以及多智能体协同编排等系统工程能力上。

来源:凤凰网科技返回搜狐,查看更多

林俊旸从阿里离职后首发长文:复盘千问路线受阻,断言AI演进全面转向智能体_思考_模型_推理

  • | 电影《碟中谍》系列中哪一部最好? |

    最好肯定是《碟中谍4》好在哪里不说了,很多答主解释的非常清楚...

    查看详情>>
  • | 你准备好迎接牛市了吗? |

  • | 为什么人到中年,很少有身材苗条的? |

  • | 什么是你去了台湾才知道的事? |

  • | vmware 虚拟机如何安装? |

  • | 有哪些新生代没见过或者无法理解的 Red Hat Linux 9 时代的事情? |

  • | 现在网络上各种前端已死,后端太卷的言论,这是真的吗?还是有人蓄意炒作? |

  • | 美国不交房产税会被赶人收房,那所谓的永久产权还有什么意义? |

  • | 为什么知乎上很少有人说要买***椅, 不觉得家里有***椅真的提高生活品质吗? |

  • | 未来20年什么是优质资产? |

  • | 为什么明朝前期兵强马壮时丢弃越南? |

  • 班长用班费买了一架 4000 块的无人机,在群里通知每人平摊...

    2025-06-26
  • 恕我见识短浅,我是通过女生才知道还有***屁股和***三角区...

    2025-06-25
  • 因为中国人被「美式键盘」给坑了。 这是早年来中国犯下的一个大...

    2025-06-25
  • 大隐隐于市就行了。 杭州有个笕桥军用机场谁都知道,毕竟一天...

    2025-06-25

关注我们

添加微信好友,关注最新动态