豆包近期完成了一次重要升级,在原有“快速”和“专家”双模式基础上,新增了“任务模式”,标志着其正从单纯的对话工具向桌面智能体方向演进。实际体验后发现,这个新模式确实能像官方定义的那样——“端到端完成任务”。
首个测试场景选择了瑞幸咖啡的下单流程。在豆包客户端内完成My Coffee Skill安装后,整个过程未触发任何系统级权限申请,既不需要访问本地文件,也无需获取浏览器控制权,Skill被部署在独立运行目录中。配置好瑞幸开放平台的MCP Token后,豆包开始搜索附近门店,但它并未主动获取实时定位,而是罗列出门店列表交由用户自行选择。即便输入“少冰”这类模糊指令,豆包也能依据商品规则自动调整配置。最终生成的订单比官方小程序还便宜了三毛钱,支付完成后顺利返回取餐码,整个流程衔接顺畅。
随后大幅提升难度,要求豆包开发一款咖啡爱好者记录App,需具备每日记录、咖啡因统计、分享卡片生成及趋势查看等功能。豆包立即进入任务执行状态,主动将需求拆解为多个子任务并实时展示进度。最终交付物包含完整产品方案、UI设计稿、SwiftUI代码及可直接运行的网页Demo,方案文档甚至标注了“SuperDoubaoAgent Product Team”的署名。当发现底部导航按钮位置不协调时,仅需通过可视化编辑模式输入“与下方其他按钮水平对齐”,豆包便能自动完成布局调整,每次修改还会生成独立版本记录便于回溯。后续追加贴图功能时,豆包延续了原有咖色系设计风格,并主动提供了超过25个功能创意。
在最后的视频宣传素材生成测试中,尽管视频工具出现异常导致未能成片,豆包仍迅速给出了替代方案,并完整保留了分镜脚本供后续使用。
整体来看,豆包任务模式的核心差异在于:不依赖系统权限的“硬接管”,而是通过Skill与MCP机制在有限边界内完成任务。相比市面上部分强调“控制电脑”的桌面Agent产品,这种路径对普通用户更易上手,落地阻力也更小。对于豆包而言,任务模式只是迈向智能体赛道的第一步,后续能以何种方式、多大程度接管用户工作流,仍值得持续追踪。
【免责声明】部分数据来源于网络公开报道及行业资讯,如有侵权,请及时与本网站联系,我们将第一时间予以删改。文中所涉观点、数据及分析仅代表小编个人观点,仅供参考,不构成任何投资建议、商业决策依据或法律承诺。投资有风险,决策需谨慎;任何单位或个人据此进行商业决策、经营行为所产生的风险,均自行承担。