星空(中国)官方网站-官方授权体育平台

中信建投自主Agent发展迅速多模态催化内容市场迭代-星空体育|官方网站登录入口

新闻中心

中信建投自主Agent发展迅速多模态催化内容市场迭代

2026-02-12
浏览次数:
返回列表

  机制与自适应思考能力,深度打通 Office 生态并实现复杂工程任务托管,推动 AI 在金融、法律等垂直场景的深度渗透;OpenAI 则推出

  ,不仅刷新编程与终端操作 SOTA,更通过端侧环境接管与自我构建能力,验证了 AI 自动化研发的内生循环。多模态领域,字节跳动

  开启内测, 通过全方位多模态参考与精细化镜头控制解决视频生成的一致性痛点,有望协同 Doubao、Seedream 构成

  Claude Opus 4.6 发布,多项核心基准测试创下业界新高。 2 月 5 星空体育网站 星空体育首页日,Anthropic 正式发布 Claude Opus 4.6,在多领域推理与 Agent能力上实现断层式领先。在衡量 AI 综合前沿能力的 ARC-AGI-2 测试中,Opus 4.6 以 68.8% 的胜率创下全新 SOTA;在 1M Token 超长上下文的 MRCR v2“大海捞针”测试中,其准确率达到 76%(对比上代模型仅 18.5%)。更核心的是,在评估金融、法律等高价值知识工作的 GDPval-AA 评测中,Opus 4.6 超出行业竞品 GPT-5.2 高达 144 Elo,并创新引入自适应思考功能,使其在面对复杂难题时能够自主分配算力进行深度推理,标志着 AI 的能力边界从基础问答正式迈入高阶专家领域。

  深度渗透办公与专业服务领域,打造数字员工生态。在办公场景, Opus 4.6深度打通了Office 全家桶,能够直接在 Excel 中摄入非结构化数据并自行推理生成复杂表格;在 PPT 中严格遵循母版排版规范自动生成完整路演材料。在金融和法律垂直场景,Opus 4.6 能够精准提取研报核心数据、识别长篇法律合同的财务风险点。

  首创 Agent Teams机制,实现复杂工程任务的全自动托管。 区别于单体智能体,Opus 4.6 在深度集成的 Claude Code 中原生支持开发者组建智能体团队协同处理任务。在 Anthropic 安全团队的压力测试中,16 个 Opus 4.6 实例组成的 Agent 团队,在无人干预的情况下历时两周、消耗 20 亿输入 Token 与 1.4 亿输出 Token,成功从零开始编写出支持 x86、ARM 等架构的 Linux 6.9 内核 C 编译器。Opus 4.6的更新同样反映

  的持续落地——即当前AI已具备长周期规划、多任务并发与自我纠错的系统性工程能力,助力用户解决复杂场景任务。

  OpenAI发布GPT-5.3-Codex,编程与智能体控制 SOTA。 在 Opus 4.6 发布仅十余小时内,OpenAI 紧急推出最强代码模型 GPT-5.3-Codex。基准测试方面,GPT-5.3-Codex 在衡量真实软件工程能力的 SWE-Bench Pro 测试中拿下 56.8% 的最高分;在终端命令行操作基准 Terminal-Bench 2.0 中飙升至 77.3%;在衡量计算机视觉操作的 OSWorld 更是以 64.7% 的成绩碾压竞品。在保持同等推理深度的前提下,新模型运行速度较 GPT-5.2-Codex 提升了 25%,并支持中途转向(Mid-turn Steering),允许开发者在 AI 运行长达数小时的任务时随时介入纠偏,大幅提升了工业级开发的可用性。

  在 Agent方面,GPT-5.3-Codex能够接管用户的整台电脑,读取本地文件夹,跨应用执行复杂操作。对用户而言,一句自然语言指令即可要求模型自动检索合适的开源工具,在后台运行脚本进行执行。GPT-5.3-Codex在本地沙盒环境中自主规划、执行、排错的能力,使其成为真正意义上的端侧生产力引擎。

  自我构建验证AI自动化研发的内生循环。 GPT-5.3-Codex是 OpenAI 第一个被投入到自我迭代流程中的模型。据 OpenAI 高管透露,在研发阶段,GPT-5.3-Codex 已经深度参与到自身的构建体系中,能够快速迭代代码审查、重构庞大的代码库,并自主完成从项目搭建、测试用例编写到 Vercel 部署的全流水线工作。OpenAI继Claude之后进一步验证AI的自我升级能力,不仅能够加速软件开发过程,更能够促进AI的自我对抗优化,持续推进AGI的实现历程。

  国产模型逆袭开源 Agent 社区,Kimi 与 MiniMax 展现全球竞争力。 在硅谷巨头激战正酣之际,中国大模型在开源应用框架

  中异军突起。OpenClaw 原作者 Peter Steinberger 在面临 Anthropic 限制后,迅速完成 MiniMax M2.1 的适配,并公开评价其“在工具调用方面表现极其出色且精准,边际成本接近于零”。

  Kimi K2.5 上线不足一周即登顶 OpenClaw 调用榜首,单周累计消耗 26.6B Tokens,一举超越 Gemini 3 Flash 与 Claude Sonnet 4.5。数据显示,Kimi K2.5 凭借仅为 Claude Opus 五分之一的定价,以及在智能体集群场景下缩减 80% 端到端耗时的效率优势,正成为全球开发者的首选。

  我们认为,国产模型在 OpenClaw 中的爆发验证了其在代码与智能体方面的技术成熟度,高性能+低成本的方案正助力中国厂商在全球 AI 应用层实现突破,打破海外模星空体育网站 星空体育首页型垄断。

  除通用模型外,多模态模型亦有更新,字节于2月7日开启 Seedance 2.0 内测,持续优化AI视频生成对生成结果的把控。Seedance 2.0 的核心突破在于全方位多模态参考与精细化镜头控制,模型支持同时上传最多 12 个参考素材(含图像、视频、音频),能够对角色面部、服装纹理及画面风格进行像素级锁定,有效解决了 AI 视频长期存在的角色一致性难题。通过引入首尾帧控制与原生音视频同步技术,创作者能够精准定义镜头的起止状态并实现口型与动作的帧级对齐,这使得 AI 生成不仅停留在空镜或单人动作,而是真正具备了处理复杂叙事与多镜头交互的能力。

  据《The Information》援引内部消息人士透露,字节或将在春节祭出全模态三件套。当前字节多模态模型主要包括Doubao多模态、Seedream、Seedance等,Seedance 2.0有望作为全模态的一环,大幅压缩内容制作成本并提升素材产出效率,并在即梦和剪映平台实现商业化落地。

  成为新流量高地。据 1 月 20 日巨量引擎漫剧生态大会数据,漫剧赛道日耗峰值已达 3000 万,预计 2026 年市场规模将突破 220 亿元。2025 年下半年,漫剧广告营销流水增长超 21 倍,每日自然流水大盘增长 144%。尽管总供给量突破 10 万部,但优质动画及 AI 仿真人剧供给仍显稀缺,自 2025 年 11 月以来仿真人剧快速起量并带动千万级大盘流量。在技术赋能下,AI 已深度融入漫剧生产管线,内容制作环节渗透率达 50%-80%,平均降低生产成本 70% 以上,提升效率 80% 以上。Seedance 2.0 的推出有望进一步缓解优质产能短缺,通过 IP(60% 爆款源自小说)与 AI 的结合,加速漫剧产业的工业化升级。

  总结:Anthropic 发布 Claude Opus 4.6,凭借 Agent Teams 机制与自适应思考能力,深度打通 Office 生态并实现复杂工程任务托管,推动 AI 在金融、法律等垂直场景的深度渗透;OpenAI 则推出GPT-5.3-Codex,不仅刷新编程与终端操作 SOTA,更通过端侧环境接管与自我构建能力,验证了 AI 自动化研发的内生循环。多模态领域,字节跳动 Seedance 2.0开启内测, 通过全方位多模态参考与精细化镜头控制解决视频生成的一致性痛点,有望协同 Doubao、Seedream 构成全模态矩阵,大幅降低内容制作成本并加速商业化落地。

  (1)宏观经济下行风险:计算机行业下游涉及千行百业,宏观经济下行压力下,行业IT支出不及预期将直接影响计算机行业需求;(2)应收账款坏账风险:计算机多数公司业务以项目制签单为主,需要通过验收后能够收到回款,下游客户付款周期拉长可能导致应收账款坏账增加,并可能进一步导致资产减值损失;(3)行业竞争加剧:计算机行业需求较为确定,但供给端竞争加剧或将导致行业格局发生变化;(4)国际环境变化影响:国际贸易摩擦加剧,美国不断对中国科技施压,对于海外收入占比较高公司可能形成影响。

  应瑛:中信建投证券计算机行业首席分析师,伦敦国王学院硕士,5年计算机行业研究经验。2021年加入中信建投,深入覆盖医疗信息化、工业软件、云计算、网络安全等细分领域。

搜索