微信扫码
添加专属顾问
我要投稿
AI硬件正迎来关键转折点,a16z合伙人首次改变对硬件投资的谨慎态度,揭示行业新机遇。核心内容: 1. AI硬件投资的历史困境与当前转变 2. a16z合伙人Bryan Kim对消费级AI硬件的新见解 3. AI与硬件结合带来的创新应用场景
欢迎关注公众号【风投十年】,加微信请备注【姓名+公司+城市+来意】,更多干货可订阅知识星球。
早在2023年各家LLM还在茁壮发育你追我赶时,笔者就已展望过未来3~5年AI应用的投资机会,也YY过AI硬件及端侧AI的演变趋势及方向(见下图,请忽略PPT的丑陋-_-||)。
https://mp.weixin.qq.com/s/neUwtG4kp4IdVBxX3sZl6g
2、《AI硬件演进路线图》
3、《端侧AI未来展望》
即便如此,仍然觉得“Talk is Cheap”,所以这两年也逐步投资AI与硬件结合的项目,甚至开始尝试更贴近产业一线去了解业务甚至参与孵化,"Be the change u want to C",所谓知行合一吧。这也是和朋友们开始张罗“浪潮将至”AI软硬件应用&出海沙龙的初衷之一,期待与各位产业伙伴提升认知,专业互补、挖掘机会,合作共赢。
关于AI硬件,全球投资机构其实一直莫衷一是,就连Andreessen Horowitz(a16z)(全球最活跃的深度布局AI领域的大型投资基金之一)也不例外。Bryan Kim(“BK”)是其主要负责投资消费级AI应用方向的合伙人。他尤其关注AI如何重塑消费者体验,涵盖多个核心主题,例如生产力(ElevenLabs、Cluely、Raspberry)、消费者健康(Function Health、Slingshot AI)、创造(Captions、Civit.ai、Glif、Viggle)以及连接(BeReal、Partiful)。他还积极探索消费级人工智能前沿领域的新类别和新行为。BK 是 Captions 和 Partiful 的董事会成员,以及 ElevenLabs 和 Function Health 的董事会观察员。
注:在加入 a16z 之前,BK 在 Snap 工作,帮助公司实现了高速增长并顺利完成 IPO。Bryan 早期职业生涯曾担任 Bungalow 的首席财务官,以及由运营商主导的种子基金 Uncommon Projects 的创始普通合伙人。他的职业生涯始于瑞士信贷的投资银行业务,为科技公司提供并购和资本市场交易方面的咨询服务。
Bryan Kim一直以来都避免投资硬件。硬件很难——昂贵、缓慢、风险大。如果说有什么不同的话,那就是如今制造和销售消费硬件的问题和十年前一样:每个人都期待苹果级别的设计,利润微薄,制造滞后,而且你完全受制于供应链。你冒着下单百万台的风险,然后世界继续变化,突然间你就被一堆卖不出去的产品困住了。然而,BK最新认为时至当下,他的感觉已有些不同,他不得不重新评估自己的信念,其核心观点编译如下:
有了人工智能,我们构建了一个近乎数字神明的东西。然后我们把它塞进一个网络应用中,对着它打字。没错,我们添加了音频、图像,甚至视频——但我们仍然主要只是通过一个盒子与它对话。如果这项技术真的像我们所知的那样强大,我们难道不应该以更有意义的方式与它互动吗?难道它不应该陪伴我们一起踏上旅程吗?
仅在过去两周,我就见了几十位硬件创始人。他们都在说着类似这样的说法:AI 需要一副躯壳。我听到过各种各样的说法,从眼镜到别针,再到 Labubu 式的玩具。每个人都在尝试。这波聪明的年轻创始人在硬件领域创业,无疑引人注目。他们的想法一致:这个 AI 幽灵需要一个躯壳(咿呀学语)。而对着笔记本电脑打字可不是个好主意。
回想一下移动端的转变。起初,在较小的屏幕上,这些行为似乎没什么不同。但后来,出现了全新的行为——DoorDash、Uber、Snap——这些产品在桌面上是不可能实现的。这是因为硬件发生了变化。有了这种口袋大小的外形,你突然拥有了定位、摄像头、支付等功能,而且你可以随时随地使用。
我敢说——人工智能还没有迎来那个时刻。它还没有面向普通消费者。目前的模型仍然过于庞大,移动人工智能还无法真正发挥作用。所以,尽管我不愿承认,但我开始思考:或许硬件才是关键。
我认为过去六个月人工智能在消费领域最大的突破是开放式记忆层。正是它让人工智能的功能无法关闭,并且无限地变得更加有用。人工智能掌握的信息越多,它的价值就越大。看看估值超过50亿美元的Oura公司。它之所以有效,是因为它通过追踪180多种生物标记物,为人工智能提供了信息。
收集至关重要的上下文有两种方式:主动输入和被动输入。主动输入就是我们在 ChatGPT 中所做的。但是,拜托:人都是懒惰的;每天晚上把白天的内容抄录到 ChatGPT 中,是早期采用者的极端行为。大多数人会选择被动输入。这就是为什么所有这些早期的生产力工具都是与你的电子邮件和日历集成的 Chrome 扩展程序。它们试图被动地收集上下文。
但这不能只停留在笔记本电脑上。它太神奇了,不适合笔记本电脑。它需要与我们一起移动。它需要融入环境。
如果真是这样,那些关注科技超过五分钟的聪明人就会问:那为什么我们还没人人都戴着人工智能眼镜、别针或戒指四处走动呢?对我来说,这似乎很明显:围绕这些产品的社交线索还没有确定下来。
社会接受度是瓶颈。无论好坏,类似谷歌眼镜的设备对大多数人来说仍然感觉科幻且令人毛骨悚然。没人想让自己看起来像是在记录一切。硬件要想取得突破,就需要隐形、令人向往,而且——真正的关键——它需要一个大家都认可且值得的用例。
这很关键。外形尺寸决定了可以收集哪些类型的数据,进而决定了AI的功能。我预测,我们将从比始终开启的摄像头更轻便的方面入手:声音。我预计我们会看到一种既能容纳麦克风又不会造成干扰的外形。我们目前还不知道它会是什么样子。但我们知道:当AI拥有上下文信息时,它会变得更加有用,而硬件可能是被动收集这种上下文信息的唯一途径。
我对争论某个品牌的眼镜或配件是否时尚不感兴趣。这种难以捉摸的硬件最终可能会与iPhone捆绑在一起,iPhone在全球的销量已经达到70亿台,或者与手机相关的其他产品,比如Airpods。不过,更有可能的是,它会由一个不受隐私限制的人来打造,这个人能够收集人工智能不可否认的价值所需的被动语境。这就引出了我们……
我最近遇到一位创始人,他正在为工厂工人而非消费者打造廉价的人工智能眼镜。他正在解决一个非常具体的问题:如何收集手势数据来训练机器人?为此,他不需要很长的电池续航时间或社会吸引力。他只需要可重复的结构化输入,而工厂是获取这种输入的绝佳场所。这并非主流用例,但非常精准。
这就是我所追求的:精准、有价值、社会认可的用例。硬件楔子就是这样产生的。
我们打造的技术强大到无法仅仅存在于文本框中。越来越多的人渴望它融入自己的生活。他们只是需要赋予它一个合适的用途。
Loveable 的联合创始人曾宣称自己正在开发最后一款软件。我们姑且假设他是对的。现在的问题是:是什么真正地把这款软件带进了我们的生活?
如果我相信这个月遇到的几十位聪明、令人信服的年轻创始人的话,那么也许,只是也许,这是硬件。(2025.8.14)
原文:Is This AI’s Hardware Moment? A Reluctant Debate.
https://a16z.com/ai-hardware/
从a16z的Bryan Kim的期许说回AI硬件需要关注的诸多要素:
比如接入设备数、在线时长、日活/月活、背后搭载的模型能力是否OK(高智商、拟人交互、主动性、低成本可商用)、功耗与算力、产品量产及迭代能力、购买者与使用者分离、数据安全及隐私保护等等,一不小心,哪都是坑。
当然,最近也传来越来越多的好消息。比如语音模型方面,当下国内外进展都在加速。2025年8月初,MiniMax就推出了语音生成模型Speech 2.5,覆盖超40个语种;2025年初,豆包App也更新了实时语音通话功能,免费向用户开放,其可以模仿不同声线,进行情绪感知等;8月29日,OpenAI发布为开发人员打造的语音转语音模型GPT-RealTime,并同步更新了包括远程MCP服务器支持、图像输入和SIP(通过会话发起协议)电话呼叫支持的API功能。OpenAI称这是其迄今为止最先进的语音合成模型,GPT-RealTime在遵循复杂指令、精确调用工具以及生成更自然、更具表现力的语音方面有所改进。该模型可以自然朗读重复的字母、数字,无缝切换语言,甚至可以捕捉笑声等非语言信号。与OpenAI同天,微软推出了首款高度表现力和自然语音生成模型MAI-Voice-1,同一提示词可以生成不同表现的音频。
目前,通用版Realtime API和新的GPT-RealTime模型已对所有开发者开放,定价方面,GPT-RealTime每百万token音频输入价格为32美元(折合人民币约228元),缓存输入每百万token为0.4美元(折合人民币约2.85元),每百万token音频输出价格64美元(折合人民币约456元),GPT-RealTime相比gpt-4o-realtime-preview价格下调20%。(敞开用token价格还是挺贵的)
另外,传统AI语音实现的传统链路很繁琐:语音转文本、文本再转语音,层层叠加。而Realtime API不一样,它只用一个模型,一个接口。直接处理,直接生成音频。延迟更低,细节保留得更好。另外,gpt-realtime现已支持图像输入。可以将图片、照片、屏幕截图等视觉信息与音频或文本一同加入到实时API的会话中。模型可以将对话内容与用户所见的画面相结合,让用户可以提出“你看到了什么?”或“读一下这张截图里的文字”这类问题。系统处理图像的方式并非实时视频流,而更像是在对话中插入一张图片。应用程序可以决定在何时、与模型分享哪些图像。
种种这些,感觉都离所谓高可靠性、低延迟、高品质的AI服务可用性又近了一步,广大AI硬件从业者,你们的Aha Moment,是不是会更快到来呢?让我们一起,拭目以待。
彩蛋:笔者目前计划在2025年10月在上海举办一场AI硬件生态活动,拟邀请包括AI应用产业链上下游伙伴齐聚现场:包括AI软硬件创业企业(商务办公、陪伴、可穿戴、运动户外等场景)、芯片/模组方案商、音视频云服务商、渠道&营销服务商等,共话AI硬件发展态势与出海机会探讨,有意参与/共建者欢迎联系:VCPirlo。
本文仅代表作者个人观点,所有信息均来自公开渠道,无任何特定指向性,不构成任何投资及操作建议,与作者供职机构及相关公司无关。部分图片、视频来自网络,如有侵权,请联系告知删除。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-09-02
AI录音卡片大比拼:一文讲懂谁更值得买
2025-09-02
为什么钉钉、360也要入局AI录音卡片?被种草之后一个反思:虽然很好用,但Rabbit R1的致命问题依旧存在
2025-08-28
一款让人欲罢不能的AI硬件
2025-08-25
我用飞书表格,实现门店的多屏的无人化管理
2025-08-25
钉钉发布首款 AI 硬件,CEO 首谈加班争议,「无招」的大招是给每个打工人配 AI 秘书
2025-08-23
前美团硬件负责人创业,做了一款项链式的「AI相机」|涌现NewThings
2025-08-22
我把滴滴出行MCP当成老年机来用,效果太棒了
2025-08-18
如何将 LM Studio 与 ONLYOFFICE 结合使用,实现安全的本地 AI 文档编辑
2025-07-08
2025-06-28
2025-07-04
2025-06-25
2025-07-03
2025-06-15
2025-07-07
2025-07-22
2025-07-08
2025-06-14
2025-09-02
2025-08-15
2025-07-08
2025-07-08
2025-05-27
2025-05-24
2025-05-17
2025-05-14