每日精选

AI 领域每日精华汇总

AI资讯日报|2026年5月17日

今日热点:谷歌密集发布Gemini Omni多模态模型及科学工具,持续引领AI能力前沿。国内AI硬件需求高景气,杭州机器人展意向合作金额突破213亿。开源社区涌现AI辅助科研等实用项目,同时AI安全与治理议题引发业界关注,技术突破、产业应用与生态建设齐头并进。

谷歌模型与工具

  • 推出 Gemini Omni|谷歌发布新一代多模态模型,核心突破在于将推理能力与创造力结合。
  • Gemini科学版:新时代发现的AI实验与工具|谷歌推出科学AI工具套件,旨在利用通用AI应对科学研究瓶颈。
  • 通过精灵项目与街景模拟真实世界地点|谷歌将AI世界模型与街景结合,可生成基于真实地点的不同风格虚拟世界。

产业与硬件动态

  • 杭州机器人展吸引全球客商“淘”宝,意向合作总金额突破213亿元|第二届杭州国际机器人展吸引473家企业,专业观众超10万,达成重大产业合作。
  • PCB钻针量价齐升|AI硬件需求高景气推动关键部件PCB钻针量价齐升,短期供应偏紧。
  • 中信证券:AI+能化可能是今年更合适的杠铃结构|券商研判“AI+能化”有望成为2026年核心配置策略,依托中国优势制造业。

开源与开发者生态

  • 6.4k Stars!用Claude Code写论文的全套流水线,有人打包开源了|开源项目ARS系统利用AI辅助学术研究,在GitHub上获得高度关注。
  • [GitHub] NirDiamant/agents-towards-production|介绍一个面向生产环境的生成式AI智能体开发端到端教程项目。
  • [GitHub] Anil-matcha/开放生成式AI|一个开源AI图像与视频生成平台,定位为商业平台的替代方案。

AI治理与安全

  • Mistral首席执行官阿瑟·门施警告法国,不要允许Anthropic的Mythos扫描军事代码库|Mistral CEO就欧洲网络安全依赖性问题发出警告,涉及军事代码库扫描。
  • 新数学基准测试揭示AI模型自信解答无解问题|新基准测试SOOHAK用于评估AI模型是否在无解问题上表现出过度自信。

科技公司与商业动态

  • 又诞生一位千亿女富豪|立讯精密创始人王来春从富士康员工成长为千亿女富豪,展现制造企业崛起。
  • 史上最大IPO来袭,SpaceX加速驶入纳斯达克|SpaceX计划6月中旬在纳斯达克上市,实施拆股降低投资门槛,目标融资约700亿。
  • 科氪 | 对话韶音高层:开放式耳机,凭什么成为下一场颠覆TWS的“品类革命”?|专访揭示开放式耳机正从运动场景向全民主力设备跃迁,引发品类革命。
  • Oppo开源安卓AI助手X-OmniClaw,可在手机本地调用摄像头、屏幕及语音功能|Oppo开源可在Android设备本地运行的多模态AI智能体。
  • 36氪首发 | 宠物健康大模型公司连融两轮,软硬一体化布局,已服务超200家宠物医院|宠物健康大模型公司“绮算法”连续融资,其软硬一体方案已服务大量宠物医院。
  • 28亿,肯德基也要被卖了?|怡和集团计划出售其在亚太市场的肯德基等快餐资产,反映外资餐饮股权本土化趋势。
  • 世界动作模型赋予机器人在行动前模拟后果的能力|世界动作模型旨在让机器人理解动作如何改变世界,实现行动前模拟。

包含文章

Gemini科学版:新时代发现的AI实验与工具

谷歌推出 **Gemini for Science**,这是一套基于其AI模型的科学工具与实验,旨在应对科学知识爆炸带来的研究瓶颈。其核心是利用**通用型AI智能体**,帮助研究者跨越海量文献与复杂计算的鸿沟,加速**科学假设的生成、验证与实验方案的设计**,从而让科学家更专注于核心的创造性问题。

87

杭州机器人展吸引全球客商“淘”宝,意向合作总金额突破213亿元

2026年第二届杭州国际人形机器人与机器人技术展览会于5月14日至16日举行,吸引了**473家**国内外企业参展,累计专业观众超**10万人次**,现场达成重大合作签约**56项**,意向合作总金额突破**213亿元**,展现了具身智能与人形机器人产业的强劲发展势头。同期,韩国政府宣布将投入约**

87

推出 Gemini Omni

谷歌发布了新一代多模态AI模型**Gemini Omni**,该模型的核心突破在于将**推理能力与创造力结合**,能基于文本、图像、音频等多模态输入生成高质量视频。其主打功能是通过**自然语言对话直接编辑视频**,并确保场景与角色的连贯性。该功能已率先以 **Gemini Omni Flash**

87

科氪 | 对话韶音高层:开放式耳机,凭什么成为下一场颠覆TWS的“品类革命”?

本文通过专访韶音高层,揭示了开放式耳机正从“运动副机”向“全民主力设备”跃迁,引发一场**品类革命**。韶音凭借在**骨传导与开放式音频**领域的15年深耕,以“全场景品类替代”为战略核心,通过解决**舒适度**与**音质**两大核心痛点,并首创**“开放式滤噪”技术**,辅以“GLOCAL”全球化

85

又诞生一位千亿女富豪

文章讲述立讯精密创始人王来春从富士康普通员工成长为千亿女富豪的创业历程。她早年任职富士康十年,后创立立讯精密,初期依附富士康发展,随后通过一系列战略并购,成功切入苹果供应链,成为AirPods和iPhone的重要代工商。近年来,公司市值大涨,王来春身价突破千亿,并正通过收购等手段加速向汽车等新领域拓

85

新数学基准测试揭示AI模型自信解答无解问题

由64位数学家组成的团队构建了名为SOOHAK的新型AI基准测试,包含439个手写数学任务,其中99个被故意设计为无解问题。该测试旨在评估AI模型不仅解决问题,还需识别问题本身是否成立的能力。 目前,谷歌的Gemini 3 Pro在研究级问题上表现领先,但正确率仅为30%。更突出的是,在识别无解任务方面,没有模型能突破50%的准确率。研究发现,增加计算资源可提升模型解题能力,但无法改善其识别问题无解的能力。 SOOHAK基准测试的目的,在于明确量化当前AI系统在从零星亮眼表现到全面掌握研究技能之间存在的显著差距。

85

世界动作模型赋予机器人在行动前模拟后果的能力。

World Action Models(世界动作模型)旨在解决当前机器人AI的核心缺陷:传统模型仅学习动作与摄像头图像的匹配关系,但无法理解动作如何改变现实世界状态。最新综述研究将约百篇相关论文梳理为两大技术架构方向,并指出该模型的关键优势——能够从日常无机器人动作标签的视频中学习,而这曾是传统机器人AI几乎无法利用的数据类型。这标志着机器人学习范式的重要转变。

85

36氪首发 | 宠物健康大模型公司连融两轮,软硬一体化布局,已服务超200家宠物医院

宠物健康大模型公司“绮算法”近期连续完成融资。该公司依托多模态大模型,打造了“软硬件一体化”的宠物健康解决方案,其核心产品已服务超200家宠物医院。通过免费AI问诊系统与智能硬件,公司形成了“数据采集-模型训练-服务闭环”的商业模式,并计划成为宠物健康管理领域的基础设施平台。

85

PCB钻针量价齐升

当前**AI硬件**需求高景气及技术迭代,推动PCB钻针消耗量与价格双双上升,相关企业正加速扩产,但短期供应仍偏紧。同时,**三星**被曝或将在下一代Exynos 2700芯片中弃用**FOWLP封装技术**,主要因成本增加影响盈利。两者共同反映出AI产业链**关键环节**的供需紧张与厂商在技术路径

85

28亿,肯德基也要被卖了?

怡和集团计划以约4亿美元出售其在港澳台及东南亚市场的肯德基、必胜客等快餐资产。此举是外资餐饮品牌在亚洲市场**股权本土化**趋势的又一案例,也反映怡和正进行**战略瘦身**,剥离非核心、增长乏力的业务,以集中资源于其更核心的地产、零售等主业。

85

通过精灵项目与街景模拟真实世界地点。

谷歌将AI世界模型Project Genie与街景数据相结合,推出新功能。用户可基于真实街景位置,并选择如“沙漠”或“海洋世界”等风格,描述角色后,即可生成以现实地点为锚点的虚拟交互环境。该技术旨在为AI智能体提供更逼真的训练场景,同时也向用户开放了创意探索的可能。 ##

85

[GitHub] Anil-matcha/开放生成式AI

该资讯介绍了一个开源AI图像与视频生成平台。该平台定位为商业AI视频平台的替代方案,支持包括Flux、Midjourney、Kling、Sora和Veo在内的200余个生成模型。其核心特点是不设置内容过滤,允许用户生成不受平台限制的内容。该项目采用MIT许可证,允许自由使用和修改,并支持用户自行托管部署。项目使用JavaScript编写,根据数据显示,尽管当前总星数为0,但单日获得了704个星标的关注度,表明其发布后引起了社区的迅速关注。

85

[GitHub] NirDiamant/agents-towards-production

该内容介绍了一个面向生成式AI(GenAI)智能体开发的端到端教程项目。该项目采用代码优先(code-first)的方式,基于Jupyter Notebook平台,提供从原型设计到企业级部署的全流程指导,旨在帮助开发者构建可用于生产环境的智能体应用。教程内容涵盖完整的技术实现路径,聚焦于将GenAI智能体从概念转化为实际可部署的解决方案。项目目前已在GitHub上获得225颗星(当日新增),表明其正处于早期推广阶段并初步吸引了开发者的关注。

85

Oppo开源安卓AI助手X-OmniClaw,可在手机本地调用摄像头、屏幕及语音功能。

Oppo旗下Multi-X团队发布并开源了名为X-OmniClaw的AI智能体(Agent)。该智能体专为Android设备设计,核心特点是能够直接在手机本地运行,通过集成摄像头、屏幕显示和语音交互,实时处理应用程序中的任务。 其技术关键在于系统并非依赖云端手机镜像,而是主要利用设备本地传感器完成操作,仅在进行复杂推理时调用云端算力。该智能体具备“技能克隆”能力,可将用户的点击操作路径记录下来,转化为可复用的技能。再次执行类似任务时,它能通过DeepLink直接跳转到应用内的深层页面,极大提升了操作效率。 这一方案将多模态感知、本地实时处理与可复用技能相结合,提供了一种新的设备端AI智能体实现路径。该资讯最初发布于科技媒体The Decoder。

85

史上最大IPO来袭,SpaceX加速驶入纳斯达克

SpaceX正大幅加速IPO进程,计划于6月中旬在纳斯达克上市,股票代码“SPCX”。公司已实施“一拆五”拆股方案,降低股价以吸引全球散户参与,目标融资约700-750亿美元,估值高达1.75万亿美元。IPO前夕,公司治理结构与马斯克绑定的超长期薪酬方案也引发关注,凸显其“火星愿景”与商业现实的平衡

85

Mistral首席执行官阿瑟·门施警告法国,不要允许Anthropic的Mythos扫描军事代码库。

Mistral AI公司首席执行官Arthur Mensch警告欧洲在网络安全领域日益增长的依赖性问题。他指出,法国的军事代码库不应交由美国AI模型进行扫描分析。 其警告的核心在于技术风险。Mensch强调,现代AI模型本身具备协调网络攻击和建议漏洞利用的能力,这其中也包括Mistral自家的模型。这意味着,将敏感的国防代码暴露给外国AI,可能带来无法预料的安全漏洞。 此外,Mensch明确排除了公司被出售的可能性,并表示Mistral的长期目标是进行首次公开募股,而非寻求并购。这一表态结合其安全警告,凸显了该公司致力于在欧洲保持技术自主性的战略定位。

85

中信证券:AI+能化可能是今年更合适的杠铃结构

中信证券研判,**“AI+能化”**有望成为2026年类似“杠铃策略”的核心配置结构,与过往几年的热门赛道逻辑一脉相承。该策略的底层支撑在于**中国优势制造业的定价权重估**,具体看好新能源、化工、有色、电力设备等行业。同时,建议密切关注**国产AI**在硬件侧放量及推动云服务发展带来的投资机会。此

85

6.4k Stars!用Claude Code写论文的全套流水线,有人打包开源了

一款名为**academic-research-skills**(ARS)的开源项目因系统性利用AI辅助学术研究而备受关注,在GitHub上获得**6.4k Stars**。该项目通过四个AI代理技能模块,整合了从文献研究、论文写作、模拟审稿到流程编排的全链条。其核心亮点在于设计了**引用核验**、

85