这个代理可以浏览哔哩哔哩、学习打扑克,甚至可以观察市场并撰写预测报告。 Flowith OS真机测试

风向标AI应用(公众号:ZhidxcomAI) 作者 |姜瑜主编|墨影智动10月29日报道,人工智能应用初创公司Flowith昨天正式推出本地代理操作系统Flowith OS,这是为该公司的Agent Neo设计的一整套操作系统。传统的网页端人工智能助手通常封装在标签页中。用户发出指令,助手被动响应。 Flowith OS 试图克服这个限制。用户只需表达自己的意图,系统就会将其转化为可以连续执行的完整操作流程。 Flowith OS 包括一个上下文增强系统,该系统使用在线强化学习不断优化。每完成一个任务,系统自动回顾执行过程,反映结果,并不断更新策略执行策略。这意味着 Neo 智能代理在您每次使用时都会变得更加智能。为了实现长期记忆积累,Flowith OS还引入了包括短期缓冲和长期情景记忆的两级记忆系统。系统不仅会记住您最近的指令,还会了解您不同时间的喜好、书写风格和用法,并在您下次使用时自动记住它们。技能和记忆融入到整体的操作逻辑中。例如,如果您保存了“图像转PDF”流程,或者习惯以某种语气撰写报告副本,您可以将其标记为技能或记忆,让系统自动将其应用到类似场景中,而无需重复设置。为了保证任务执行的响应能力,Flowith OS还具有执行核心和速度缓存机制。系统通过并行任务处理和预加载频繁操作的模块来实现快速的本地执行响应。在实际操作中,该系统执行“批量PDF生成”等过程”和“航班信息提取/CSV转换”。它可以完成社交平台账户管理、发帖、点赞和评论等自动化操作。更复杂的任务,如视频生成、标题创建、自动上传等,也可以在系统内管理。根据评测结果,Flowith OS在Online-Mind2Web基准测试的所有四个难度级别中均领先,平均准确率为95.4%,在简单和简单上分别达到96.3%和97.7%。中等任务上,分别明显优于 ChatGPT Atlas(平均 61.3%)和 Gemini 2.5(69%)等对手。在第一次启动阶段,系统会提示用户完成一系列初始配置,其中包括从 Chrome 或 Safari 导入浏览历史记录和标签以无缝切换到新环境。d 将其设置为在启动时启动。整个过程中,系统明确标注“100%本地存储”。 ,所有跑步历史记录、帐户数据、内存和技能内容都存储在您的设备本地,不会同步到云端。启动完成后,用户将进入操作系统主界面Flowith。系统使用“OS Awakened”作为工作的入口点。中央搜索框支持导航、问题和命令输入。下面您将看到您今天可以执行的双重任务,例如自动生成 TikTok 内容、批量管理社交媒体评论以及快速获取商业创意。左侧分为三类:技能、记忆、知识库。用户在功能上集成了操作系统、浏览器和任务调度系统的功能。让我们看看这个系统在现实生活中可以执行的任务。让AI全程监控市场并生成预测性AI报告只需单击一下,该项目将允许 Flowith 根据真实市场数据并连接到交易跟踪界面实时管理 10,000 美元的资金。 NoF1.ai 每天同步六个模型的性能。图中展示了10月18日以来各个模型的收入轨迹走势。Grok和Claude处于中间位置,而GPT-5和Gemini则处于相对较低的水平。 Neo随后提取相应的仓位结构,用于计算当天的风险敞口和杠杆水平。然后系统根据过去几天的收益和仓位数据分为三个部分:前一天的策略偏差分析、第二天的趋势预测和模型置信指数。其中,DeepSeek 和 Grok 的可靠性指标最高,分别为 90 和 85。 Gemini在最后保持“短”策略,在整个任务执行过程中,系统完成实时数据采集、识别模型st率并生成预测结果,并以结构化方式生成所有模型的收益、方向和可靠性信息。除了创建定量分析报告之外,我还在尝试使用 Flowwith OS。 “牌桌”测试你对游戏决策的快速反应能力。体验二:AI坐在游戏桌前,独立完成整个游戏。第二个体验任务围绕在线德州扑克游戏。根据博弈论最优策略(GTO)的原则将特工 Neo 设置为玩家。做出决定的人工智能玩家。当用户向Neo提交任务时,系统会自动打开目标网站并进入中等难度的游戏。然后它会依次识别游戏 UI 中的关键信息,例如启动资金、游戏位置、按钮区域、公共卡牌区域等,并开始运行完整的游戏。过程。 Neo 根据情况自动决定是否跟注、加注或弃牌在预处理阶段您的起始位置和手部力量。在进入翻牌圈之前,系统会分析牌的构成和对手的行为,并根据你的手牌质量和下注池的大小来完成你的行动。在一轮游戏中,Neo展示了预测手牌范围、识别对手下注范围、调整下注节奏、根据实际牌动态更新策略的相对完整的操作流程。在某些回合中,该系统在面对对手的大幅提升时也表现出了合理的防守处理能力。从执行结果来看,整个任务完成了打开网页、识别情况、点击按钮、执行动作的过程,无需人工干预。系统可以根据桌面的状态实时更新决策,最终完成一轮游戏操作。对于轻场景,比如浏览Bilibili或者发表评论,无需点击即可直接掌控。经验三:AI成为“轰炸主播”,能读懂评论、能读懂表情包。体验的第三个任务是在B站发表评论。尼奥的角色被确立为与他关系密切的人。熟悉互联网环境、具有互动意识的评论者,旨在快速完成热门视频的评论录入和提交操作。系统启动时,会自动进入B站首页,进入“热门”栏目,选择观看次数和讨论次数最多的视频。然后尼奥先确定了页面的结构,很快找到了评论区,并滑动到了底部。整个评论流上传完毕后,系统自动扫描当前评分最高的评论内容,观察用户与哪些关键词互动,并生成消息:“UP主已更新,我的哟uth已复活!”“该评论内容已录入并提交。从浏览输入到评论提交的整个过程都是自动完成的。运行过程中,系统正确处理评论框加载、页面滚动、多次提交等细节,保证评论内容完整发布并显示在评论区列表中。在该任务中,检查了浏览器页面上的Flo与操作系统的交互能力,使Agent能够稳定地识别Web结构中不同模块的状态变化并执行任务。简而言之:人工智能代理已经开始接管屏幕上的一切,从事务分析到全部。 Flowith OS不像传统AI助手那样等待用户输入显式指令,而是在本地模块化、记忆并完成复杂的交互过程。并学习。接触更多真实场景​​并积累长期使用数据,这款操作系统在代理层面值得持续关注和期待。
特别提示:以上内容(包括图片、视频,如有)由自有媒体平台“网易账号”用户上传发布。本平台仅提供信息存储服务。
注:以上内容(包括图片和视频,如有)由网易号用户上传发布,网易号是一个仅提供信息存储服务的社交媒体平台。

此条目发表在吃瓜热门分类目录。将固定链接加入收藏夹。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注