栏目分类

热点资讯

你的位置：开云 (集团) 官方网站 Kaiyun 登录入口 > 新闻 > 开yun体育网等于在 Manus 握住的崩溃破绽-开云 (集团) 官方网站 Kaiyun 登录入口

开yun体育网等于在 Manus 握住的崩溃破绽-开云 (集团) 官方网站 Kaiyun 登录入口

发布日期：2025-03-24 22:53 点击次数：116

文｜邓咏仪

编著｜苏建勋

（鉴于 Manus 引起的炒作争议，36 氪荒芜声名，本文绝非投放，本色上，咱们连要到邀请码都颇费了一番曲折 ……）

应该无需赘述 Manus 的引起的颠簸了：群众仍是在多样视频切片中，看到 Manus 勤极力恳地搜府上、作念 PPT、缔造网页小游戏。回放表情的共享联想，让东说念主一眼就能感受到 Agent 带来的直不雅效率擢升，这也让 Manus 资历一场赶紧破圈。

在迂回拿到邀请码后，36 氪编著部有计划了一下，为了更好地了解 Manus 的特点和功能，咱们决定请 Manus 来当实习生，按照正常的使命流给 ta 分派任务，望望 Manus 能否胜任。

OK，输入邀请码，36 氪的新实习生 Manus 就位！

源流：Manus

先说第一不雅感，若是你要请这位"实习生"，可能第一个需要接受的试验现象等于：这是位容易宕机的同学。

Manus 如今的工作极度不踏实。36 氪在周末实测时，第一嗅觉等于：让东说念主崩溃 …… 任务频繁遇到停滞，因为 Manus 在云上的造谣机跑，不时需要手动重置，才智无间跑。

本期实测，等于在 Manus 握住的崩溃破绽，测出来的。

测试的界面，老是停留在"连续已断开"、"遇到严重问题"，需要握住重置 / 开启新会话 …

偶尔出现的幻觉（不细目是幻觉如故官方奉告）也很真实。Manus 前一句还在说需要两小时升级珍惜，你再敲敲它，它就无意又开动干活了 ……

捉摸不透的 Manus

Manus 堪称是"第一款通用型 Agents（智能体）"，这意味着它不走垂直巨匠门道，上风在于更通用才略的任务。Manus 的官网就列出了多个分类：

Manus 官网源流：Manus

Agents（智能体）不同于大模子，若是说大模子只须一个对话窗口，达成信息输入 - 输出。那么 Agents 就格外于让大模子有了行径才略，可以纯真调用万般用具完成任务。

36 氪决定先从咱们编著部的日常使用场景启航，以从易到难的程度成列，请 Manus 都跑一遍。

请瞩目，以下场景均为一次性输出的散伙，除了任务半途崩溃重置计较机除外，36 氪莫得作念任何的类似测试。

校对及整理

咱们先请 Manus 完成相比基础的校对、整理使命。

36 氪将此前的一份访谈灌音原文（约 2.8 万字）交由 Manus 进行整理，中枢条件是对灌音速记"一字一板整理，不要压缩"，去除相应的口癖、对语义不清的部分进行校对。

在曩昔的操作中，起码要往来和模子交互十屡次：将灌音速记中的很是进行东说念主工校对——再分段扔到模子中——输出收场后，还需要从头投喂给模子进行校对，看是否有事实很是。

但 Manus 很昭彰将以往的多个尺度压缩到一个尺度，这种下达任务之后恭候验收的嗅觉，比和 ChatBot 交互体验，十足是十倍以上的体验擢升。

源流：Manus

但 Manus 的颓势亦然昭彰的：落魄文太短，幻觉依然有。许多复杂任务还莫得完成，就因为 Token 消耗太多而中止了任务。

在校对润色这一任务中，最终输出的文档长度大大压缩，基本只输出了访谈的终末一部分，统共 3800 多字，前边的部分基本丢失。但从已输出整理的部分来看，口吻、信息完好性如故算可以。

Manus 在履行长文任务

这大约率是因为推理和合作机制作念得还不够好，模子只可提供一次性输出的散伙，导致压缩；也有可能是 Memory 机制还未能作念得很好—— Memory 可以看作是模子暂时存储信息的 " 仓库 "，比如聊天机器东说念主会记取你之前说过的话。

早前一些有计划使命指出，memory 会跟着时间或任务尺度的加多而消退。而 Agent 所消耗的 Token，比起单 ChatBot 起码是两个数目级的擢升——一位 Agent 从业者对 36 氪推断，Manus 的一个复杂任务的 Token 消耗推断会有百万 Token 级别。Memory 的分层管制、压缩等技能难点，还有许多擢起飞间。

新闻跟进及写稿

对一般的 ChatBot 来说，输出长度都是一个老浩劫—— 36 氪之前的测试体验中，若是是一个 128K 的模子，一般而言单次输出长度都在 1000-2000 字傍边，才智保证信息完好性，不被无数压缩。

36 氪先让 Manus 完成最基本的新闻跟进使命。这包含几项才略：日常的新闻监控——看是否会筛选靠谱的信息源，再进行贫穷性分析判断，以及找相应的府上，加以补充和跟进。

源流：Manus

Manus 开动进行学习圭表 - 搜索干系新闻等等，然则在走访路透社时被考证码挡住了，申请东说念主类收受。36 氪收受后，发现 Manus 仍是被认证为机器，被屏蔽了。

源流：Manus

Manus 约花消 9 分钟完成这个任务，输出 5 条最值得关注的 AI 新闻，新闻源都是靠谱巨擘的。终末，Manus 终末选定了写相关我方的新闻 …… 哈哈。

Manus 写相关我方的新闻

Manus 的新闻文本输出仍是算是 70 分水平，翰墨清晰，主要信息点都能隐私，但和参考的范本不同，当前的文本偏软，AI 味较重。

但在咱们冷落修改意见后，第二版好了许多。

基本是可以轻飘诊疗调后，平直发表的水平

难度往上，咱们也在 Manus 也输入了一段 prompt，让 Manus 帮衬平直以 36 氪的深度报说念栏目"深氪"为例，生成一篇长文：

这周"稚晖君"创立的智元机器东说念主预报要发新品。"稚晖君"原名彭志辉，请你搜索彭志辉以及智元机器东说念主的历史经过，用 36 氪的作风去写稿一篇著述，主题为回溯智元机器东说念主的历史，以及反应这家公司的成长，在科技行业中的风趣，长度为 5000 字傍边，可参考深度报说念"深氪"栏目标作风。

请瞩目，语句需要潜入浅出，平时东说念主都能看懂，不要堆砌专科术语。

Manus 自动进行了府上汇聚，写稿阶段平直进行分段写稿，再团结，得手地完成了长文写稿，输出散伙：

写稿一篇相关智元机器东说念主的深度长文

在输出的著述中，Manus 在深度写稿上效果一般，更偏府上型整理。但遣意造句也算及格，然则作风如故偏软文。在高质料内容方面，Manus 的品尝还有待加强。

数据分析及可视化

有计划型任务亦然 Manus 的毅力。

从性质上来讲，Manus 给与了多智能体架构。浅易来说，等于可将复杂任务拆解为子任务（如数据清洗、特征工程、模子历练），通过不同的智能体，单干并行处理，显赫擢升数据分析效率。

不外，若是一致性作念不好，多智能体的局部决策可能导致全局散伙偏差较严重。

36 氪让 Manus 和 OpenAI 旗下的 Deep Research，都试着作念了一张"大模子 API 两年多以来的的 API 价钱走势表"。

OpenAI 旗下的 Deep Research 则是单智能体，端到端历练的模式——仅一个中心化智能体负责统统任务，决策与履行合资化。但平正在于模块集成度高，易于管制，输出质料相比有保证。

源流：Manus

Manus 花消的时间较长，约三个小时，生成了一个可以交互的网页。互动性和表格样式都格外可以。不外数据轮廓程度，和挑升作念有计划的 Deep Research 仍有差距，但问题不大

源流：Deep Research

Deep Research 暂时还无法输出图表，但从输出的内容质料来看，是当前的 Manus 还没法赶上的。

创意型任务：可以作念，但审好意思有点难评

咱们也让 Manus 上了点难度。

第一个任务是师法行业大 V "影视飓风" Tim 憨厚的作风，作念一期相关 Manus 干系的视频，长度在 5 分钟傍边。

Manus 用了约 45 分钟完成了这一任务，全程丝滑，依旧是埋头苦干拆任务，先上油管学习影视飓风的视频，再征集府上写剧本。

源流：Manus

终末产出的内容，表情严谨，是一个结构完好的小科普视频——

源流：Manus

咱们教导了视频组的憨厚，评价是：实习生水平，优点在于把使命流说认识了，分镜和镜头调理可以平直用作参考，但内容还不成平直用。

第二点是，视频剧本过于亢奋，全场充斥着"炸裂""颠覆"之感，对东说念主类的状貌领会相比名义，有点难绷。

节选一段，供群众参考：

第二部分：Manus 的中枢才略（1:10-2:20）

[ 场景：主理东说念主夸张地在电脑前招架，被多样文献和任务包围 ]

主理东说念主：（夸张的无言颜料，抓狂状）咱们都资历过这样的时刻——需要整理无数数据、撰写阐明、分析商场趋势 ... 这些使命可能要花消咱们几小时，以致几天！而且还很容易出错！

[ 殊效：时钟快速旋转，日期页快速翻动 ]

主理东说念主：（一霎振奋，眼睛发亮）但有了 Manus，这一切都将编削！它就像给你复制了一个数字版的我方，但更机灵、更高效！

[ 分屏效果：四个窗口同期展示 Manus 的不同才略，每个窗口都有动态效果 ]

主理东说念主：（指向第一个窗口）Manus 的第一大中枢才略：自主完成复杂任务！

[ 窗口放大，展示 Manus 自动撰写阐明的加快经过，从汇聚府上到制品输出 ]

主理东说念主：（证明，语速适中）你只需要告诉它你需要什么，然后 ...（打响指，配合音效）它会我方狡计、搜索信息、整理数据、撰写内容，最终拜托一份完好的效果！就像有了一个永不疲困的助手！

[ 殊效：第二个窗口放大，伴跟着转场音效 ]

主理东说念主：（存眷飘溢）第二大中枢才略：多范畴通用才略！不管是金融分析、熟悉内容创作、旅行狡计，如故代码缔造，Manus 都能胜任！

[ 快速裁剪展示 Manus 处理不同范畴任务的画面，每个场景都有对应的图标和翰墨标签 ]

主理东说念主：（夸张的诧异颜料，手势丰富）这就像同期领有了一个金融分析师、一个内容创作家、一个旅行参谋人和一个尺度员！而且，它们都是 24 小时待命的！不需要休息，不会喊累！

[ 殊效：第三个窗口放大，伴跟着科技感音效 ]

主理东说念主：（奥秘口吻，略微裁减音量）第三大中枢才略：多模子合作机制！这个有点专科，但极度酷！

[ 动画展示多个 AI 模子协同使命的想法图，类似于团队合作的可视化 ]

主理东说念主：（证明，配执势）Manus 不是依靠单一大模子，而是给与 " 多重签名 " 机制，由多个寂寥 AI 模子共同驱动！就像一个高效的团队，每个成员负责不同的任务，互相当合，确保散伙的可靠性和准确性！

36 氪还让 Manus 试着作念了一个偏分析型的创意使命——对咱们的微信公众号版式和联想分析后，进行修订。

为了更明确联想需求，咱们也给 Manus 提供了一份联想案例，以及咱们以为作风高出、审好意思优秀的数个公众号，行为参考。

源流：Manus

Manus 依旧很快就对任务进行拆解，自然终末任务莫得雅致完成，但如故输出了一套完好的决策给咱们。

除了咱们建议的尺度（分析好版式的共性、联网搜索相比优秀的公众号联想实践，冷落建议），Manus 还我方狡计了更多尺度，也作念了更精良的分类，包括分析 36 氪公众号，分为联想元素、板式布局、视觉钞票、配色决策等等。

不外从散伙可以看出，Manus 在审好意思这件事上 …… 并不擅长。就配色来说，Manus 给出了一个放之四海而齐准的决策，分为春夏秋冬四个季节，配色饱和渡过高，审好意思可以说约等于莫得。

源流：Manus

字体亦然分为多个版块，并不调和。

源流：Manus

Manus 的输出依然极度依赖于公网数据的质料。

在 Manus 学习排版、联想干系常识时，洞开了不少知乎网页。但 Manus 很难绕过登陆约束，然后就会转战到其他公开网页。更不消提如同寂寥王国通常的各大 App ——比如微信公众号内的数据，爬虫用具也很难十足波及。

被知乎登陆窗口卡住屡次的 Manus

可能这需要期待以后模子间的接口进一步买通，包括端侧 Agent 跨平台等才略的发达，才智让 Agent 输出质料有质的擢升。

终末，咱们试着让 Manus 使用高推理模式，生成一个 Jellycat 主题的吃豆东说念主游戏，Manus 花消约 45 分钟时间完成。

源流：Manus

吃豆东说念主网页游戏

可以看到，代码和游戏开动界面都仍是格外完好，但终末到了"开动游戏"这一关键，音效都能听到，但无法点击开动游戏。尔后，对话因为落魄讳疾忌医长，罢手响应了。

追想

在测试经过中，36 氪最大的嗟叹在于，前端交互极度丝滑，有一种神圣的好意思感——从参预 Manus 官网到本色对话，Manus 都在营造一种"对面真的是个活东说念主"的嗅觉。

尤其是在对话窗口左右，可以洞开一个名为" Manus 的电脑"的小窗口，及时裸露 Manus 正在操作什么，真的像汉典看着一位实习生同学，帮你完成任务。

你可以随时拖动程度条，稽查 Manus 正在进行的任务。对仍是完成的尺度，Manus 都会提供类似网页快照的界面，让你对任务发达有昭彰感知。

Manus 正在通过百度百科学习智元机器东说念主干系布景府上

另一个体验优秀的场所在于，Manus 对用具的调用顺利率算是相比高的。在不遇到崩溃、宕机的情况下，若是测试 10 个任务，大约能有 8 个自动完成任务，无需东说念主类介入。

这能大大擢升用户体验——在曩昔，许多 agent 调用外部用具的顺利率都在 60% 以下，体验欠安，难以诱骗到更多的用户。

商场普遍以为，Manus 团队对万般通用任务都先置入了不少 CoA（代理链）模版，隐私稠密通用任务（写稿、数据分析、攻略等开放式问题）等等，这些使命显赫提高了任务顺利率。

这种机制，类似在 DeepSeek 对话中握住蹦出来的想维链，用户可以看到，Manus 是如何样一个接一个调用外部用具的。

Manus 的纠错才略也很强。

36 氪屡次发现，Manus 在职务进行经过中会遇到很是。但 Manus 会尝试不同的科罚决策，直至没法科罚，才会向东说念主类报错，让东说念主类介入到问题科罚中。

源流：Manus

用户还可以随时打断 Manus，我方来完成某些尺度。

在" Manus 的电脑"窗口右下角，有一个"收受"按钮。一朝任务进行得永别，东说念主类可以平直打断进程，我方参预到这部"云上电脑"进行操作。

不外可能是计较资源不够，36 氪在操作 Manus 的电脑时，卡顿严重，只可对付进行操作。

Manus 的电脑

这样的表情自然更合适东说念主类使命的交互表情——只须使用一次，模子尽可能地自行纠错，减少东说念主类参与的次数。

追想一句话：分析追想、数据分析、开放性问题等需要强逻辑性的任务，是 Manus 最擅长的部分。最不擅长的是创意使命，审好意思基本等于莫得。

不外，受限于当前的工作踏实性和落魄文窗口，Manus 完成任务的逻辑和经过很好，但拜托质料只可说在中等水平，包括数据、文本等，都需要东说念主类进行二次校对。但从完成任务的时间和质料来说，仍是算是很可以的同学。

不管是对文本、图像、视频等干系内容，Manus 调用大模子只可师法到内容的框架，就像一层皮——但内容质料如故需要东说念主类强把关。

从周末的争议中再次回看 Manus，36 氪频繁想起的，是 2009 年的电影《阿凡达》上映之时。其时的阿凡达，是殊效电影的集大成者，一个最贫穷的风趣在于，让全球不雅众都见地到：顶尖的电影工业水平是这样的。

如今的 Manus，尽管还处于相比疏漏的样子。但至少在居品层面，和岁首爆火的 DeepSeek 有一个共通点：用技能平权的妙技，将 AI 居品赶紧拉到群众眼前，而不是停留在小圈子中狂欢。

Manus 集成了当前编程缔造才略最强的 Claude，况且受到许多最新技能效果如 CodeAct 的启发。比起 OpenAI Operator 或者 Devin 高达数百好意思金的订价，Manus 的老本价简略在 2 好意思元傍边。

而且，Manus 通用任务的体验仍是填塞丝滑，这让普罗群众都能感受到：" AI 竟然还能这样玩"，以及真确感受到 AI 对东说念主类带来的广泛着力。

这亦然现阶段开yun体育网，AI 居品在能为商场孝顺的的最大价值。

上一篇：欧洲杯体育微软在援手文档中说明了这一问题-开云 (集团) 官方网站 Kaiyun 登录入口

下一篇：欧洲杯体育微软云增速一度超 35%-开云 (集团) 官方网站 Kaiyun 登录入口

栏目分类

热点资讯

开yun体育网等于在 Manus 握住的崩溃破绽-开云 (集团) 官方网站 Kaiyun 登录入口

相关资讯