[AIassistant] PS: 感觉不是很好

按三条主线来梳理:推理(Reasoning)、Agent(具身/工具/桌面控制)、Coding(软件工程落地),并配上训练/推理框架的现状与选型建议。

一句话总览


1) 推理:从“多算几步”到“给过程打分”

模型与方法

训练框架现状

推理框架现状


2) Agent:从“会用工具”到“会用电脑”

产品化进展

多代理/编排生态


3) Coding:评测换赛道,走向“能合 PR”

能力现状(以真实修复为准)

平台与代理

训练/推理要点


4) VLM:多模态“实时 + 长上下文”常态化


5) 训练框架与分布式:更大更快也更省


6) 推理框架选型(LLM/VLM 通用)


7) 你可以怎么押注(实操建议)


参考与延伸


更新的论文参考:

根据 2025 年下半年(尤其是 9 月前后)的研究进展,LLM/VLM 领域在推理(Reasoning)、智能体(Agent)和编程(Coding)能力方面呈现出显著的技术演进和应用拓展。以下是对这些趋势的详细分析:


🧠 推理能力:从“多算几步”到“过程奖励与自我反思”

关键进展:


🤖 智能体能力:从“工具调用”到“自主操作”

核心框架与应用:


💻 编程能力:从“代码补全”到“自主修复与算法设计”

研究与应用亮点:


🧩 多模态与推理框架:实时与长上下文的融合

技术趋势:


🧭 训练与推理框架的现状

训练框架:

推理框架:


🧪 评估基准与新兴趋势

编程能力评估:


🧭 实践建议与选型指南