奇多多AI学伴亮相2025云栖大会,无界方舟用AI“慧眼”开启智能早教时代

在近日举办的2025云栖大会现场,无界方舟推出的国内首款基于「端到端实时多模态互动模型」的AI学伴机器人——奇多多,成为全场焦点。这款产品在京东预售仅上线一周,销量便突破了10000台,这个数字不仅体现了市场对优质AI早教产品的渴望,更预示着多模态大模型在消费级硬件领域的商业化曙光正在到来。

6389476324432409925910354-1

正如一位现场宝妈所说:“太好了!终于不止是AI玩具了,而是解决了很多早教痛点问题。”在AI技术日益成熟的今天,奇多多的成功或许验证了:在早教赛道,“功能驱动”比“概念炒作”更能让市场买单。更令人瞩目的是,奇多多在展会期间,现场获得了上百位家长下单预定,同时吸引了几十家AI产品后续对接无界方舟EVA模型的合作机会,成为本届大会最具商业潜力的AI硬件产品。

6389476032217583303512667-1

云栖大会现场火爆,奇多多展现真实力

在云栖大会3号馆·前沿应用馆奇多多星球展台,奇多多吸引了大量参展观众及宝宝驻足体验。孩子们手拿绘本、练习、玩具、绘画作品等,与奇多多进行自然互动,现场气氛热烈。

6389476032716553391422560-1

奇多多展现出的不仅仅是语音交互能力,更是真正的多模态理解能力。它能够识别孩子手中的任意绘本/教材/卡片等读物,无论中文、英文,甚至儿童读物复杂分散的混合排版,都能精准识别;它能看懂孩子的现场绘画;它能对日常物品进行即时有趣的科普,将深奥的科学原理,以孩子能够理解的语言描述,符合孩子“边看、边问、边学”的科学习得链路。

展会的三天时间里,奇多多展示了令人惊叹的阅读能力:除了所有书本都能识别外,还提供了三种阅读模式:

朗读模式:可识别所有类型的读物、多种主流语言文字,语音富有表现力,避免机械感;

翻译模式:支持多语言即时互译,读一句英文、翻译一句中文,让孩子有兴趣阅读全英文材料;

指读模式:文字、单词、图案均可识别,并给出相关科普,替代传统点读笔、词典笔。

“这意味着家长不再需要购买点读笔、词典笔、故事机等多种产品。”一位现场宝爸评价,“一机解决所有阅读需求,能帮助孩子读课本,和学校课业结合,这才是真正的解决刚需。”

6389476033232864351276085-1

“与传统AI产品的交互不同,奇多多不需要按压拍照或按压对话,也不需要等待漫长的响应时间导致注意力转移。”无界方舟CPO杨冬蕴(小乔)在现场介绍,“孩子们可以更自然地边看、边问、边学,这是符合儿童认知行为的革命性突破。”

6389476034237257948540270-1

突破性功能:从“AI陪伴功能满足的质变

预售破万,奇多多究竟做对了什么?

小乔表示:“首先非常感谢广大用户对奇多多的喜爱和认可。奇多多的突破主要在于两方面:一方面是回归第一性原理,对早教产品功能做深度挖掘;另一方面是我们自研的EVA实时多模态互动模型,能真正满足产品需求。”

从国内几个主流电商平台的退货率数据可知,早教产品退货率高达30%-70%。其中退货率偏低的是故事机、熏听机这类产品,AI类产品的退货率是非常高的。所以早教硬件看似是红海赛道,实际产品力上并没有满足家长和宝贝们的需求。

6389476034667234737294446-1

奇多多的突破性功能主要体现在三大方面:

1. 世界的眼睛:AI识物科普与全能阅读

无界方舟创始人&CEO曾晓东博士指出:“常见的「语音AI+CV视觉模型」在真实幼龄场景中会有四重失效,具体表现为,常见的儿童语音识别错误率高达52%、对任意书籍的识别准确率不足35%、对常见物品误识率超40%、复杂概念解释远超认知水平。”

EVA通过“模态中枢+成长型认知引擎”架构实现突破,从“成人适配”到“儿童友好”,其中视觉能力为核心支撑:

打通视觉理解【眼】:儿童“边看边问”是核心交互习惯,除AI语音外,奇多多更有视觉识别能力,并带给孩子知识科普拓展。书籍、日常物品、涂鸦作品、学校发的奖状奖品等,这些孩子喜欢展示和提问的物件,奇多多均可识别。

除AI视觉识物和科普外,奇多多还有强大的阅读能力,支持不同字体、多语言、全类型读物的识别。宝贝家里的绘本、考卷、课本、期刊、卡片全能识别和阅读,提供3种阅读模式:朗读、翻译、指读,有效替代点读笔、词典笔等产品。

6389476035161474099218431-1

 

2. 堪比真人的低延迟反馈速度

革新延迟标准【快】:语音交互延迟≤250ms(匹配快速注意力转移特性),视频交互延迟≤400ms,书籍识别/实物识别延迟≤300ms(采用边缘端视觉特征加速算法,支持即时反馈)。即使受限于硬件设备性能,也可以控制在秒级响应。

6389476035550341727030509-1

0-10岁儿童的注意力持续时间仅为10-30分钟,超过1秒的响应延迟就会中断注意力,而缺乏视觉理解的实时互动则会切断“从看到学”的核心链路。很多AI语音产品采用按压式交互,反馈在6秒以上,孩子是无法沉浸使用的。

“孩子问‘这是什么’时,如果等待超过1秒,他们的注意力就可能转移。”小乔解释道,“我们的技术团队为此进行了大量优化,确保交互过程自然连贯。”

6389476035954834319327727-1

3. 成长的个性化陪伴感

情感与成长体系【伴】:具备48种情绪计算体系,100+种眼神表情互动,可克隆父母的音色与孩子对话。更有个性化记忆引擎带来AI成长体验,使每个孩子都有专属于自己的奇多多。

奇多多是带有成长属性的AI产品,会随着用户的使用,个性化适配用户,记得用户的重要事件,让每个孩子拥有属于自己的奇多多。其背后的关键是“存储型记忆 + 参数化记忆”的技术结合,为宝贝们打造专属的 “记忆引擎”。

6389476036482175785451240-1

技术内核:EVA大模型如何突破行业瓶颈

曾晓东博士深入解析了背后的技术原理:“首先我们需要的是一个极强的实时多模态大模型来赋予硬件‘真人般的交互’,多模态模型因其能够融合文本、图像、音频等多种信息形态,提供更智能、拟人化的交互,而成为重要研究方向。我们从去年年初就着重布局这个方向,在业界没有任何现成开源方案的情况下,率先在去年8月份推出了国内SOTA的EVA端到端多模态模型,率先解决了多模态商业化致命瓶颈,为AI应用赋予了‘超级感官’与‘真大脑’,填补了走向商用落地的最后一公里。”

在此基础上,EVA为奇多多做了儿童早教场景的深度模型适配。最特别的是看懂“万物与书籍”的视觉魔法——AI识物科普与AI所有书全能读。

6389476037239455789604346-1

早教场景视觉识别面临四大核心挑战,包括非标准书籍(多样排版、手写字体等)、实物形态多变、复杂环境干扰以及儿童非标准书写和涂鸦。普通AI识别准确率低于30%,实物混淆率超45%,难以满足儿童学习需求。

EVA针对早教场景进行了全面的场景化视觉能力优化。其“书籍全域识别引擎”支持所有类别书籍甚至手写本,通过字体扩展、排版分析和印刷增强实现96%的准确率,并可同步语音朗读与科普互动。在实物识别方面,采用小样本学习技术,仅需3-5个样本即可识别新实物,结合多模态科普和抗干扰优化,在复杂环境下仍保持93%以上准确率。针对儿童手写和涂鸦,EVA通过专用训练数据集和模型优化,实现94%的作业识别准确率,并能对非标准书写保持鲁棒性,还可将涂鸦关联科普内容激发创作兴趣。

6389476037703902171085467-1

个性化与隐私保护的完美平衡

在个性化方面,小乔介绍:“AI陪伴类产品,只有做好个性化成长时,才能提升使用时长和活跃度。奇多多是带有成长属性的AI产品,会随着用户的使用,个性化适配用户,记得用户的重要事件,让每个孩子拥有属于自己的奇多多。其背后的关键是‘存储型记忆+参数化记忆’的技术结合,为宝贝们打造专属的‘记忆引擎’。”

6389476038246677249625194-1

这主要依靠三个模块协同工作:认知记忆模块会追踪孩子的知识轨迹,并构建认知标签;情感记忆模块则本地化存储孩子的个人偏好;交互记忆模块会依据艾宾浩斯遗忘曲线动态调整记忆内容的优先级。

针对家长关心的隐私安全问题,曾晓东博士强调:“这是我们极其重视的关键问题。我们通过多层技术保障、完善的家长控制功能、透明的数据承诺以及合规的设计,全面消除家长对数据隐私的顾虑。”

“我们创新性地研发PrivateLoRA技术,进一步加强儿童信息的安全与隐私保护。EVA基于PrivateLoRA构建了一套隐私优先的大模型架构,其核心思路是将涉及用户隐私的计算任务本地化——迁移至个人终端设备执行。该技术借助低秩适配(LoRA)方法,在微调大模型时仅训练和更新少量参数,无需原始数据上传至云端,既降低了数据传输中的泄露风险,也利用本地算力实现深度个性化处理。”该技术我们已向技术社区开源(https://wanglamao.github.io/),为推动隐私保护大模型的发展贡献力量。

6389476038670163919164216-1

开放生态:EVA OS让每个硬件都拥有视觉智慧大脑

曾晓东博士分享了EVA OS的未来开放计划:“简单来说,EVA OS将奇多多最核心的‘眼睛’和‘大脑’做成了一个标准化、可插拔的软硬件一体能力包,任何想做智能硬件的公司,无需从头研发AI,直接使用我们的研发套件即可。”

EVA OS主要开放四类能力:多模态交互API、知识与视觉接口、硬件适配SDK以及广泛的硬件兼容性。首批合作伙伴已取得显著成效:某知名儿童出版社接入EVA书籍识别能力后,其小众科普书的用户阅读时长提升3.5倍;户外玩具厂商通过实物识别API,使望远镜产品增加“识别花草/鸟类”的科普功能,销量增长52%。

未来,EVA OS致力于打造一个开放、协同的生态。不仅提供技术接口,更通过开发者社区、详尽的文档和技术支持,持续赋能合作伙伴,共同推动多模态AI在智能硬件领域的创新与应用。

我们希望作为先行者,让科技平易近人,实现科技普惠、行业共荣!

6389476039220993773217269-1

本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。https://www.dmsdw.cn/73040.html

(0)
上一篇 4小时前
下一篇 2小时前

相关推荐