2023-07-07 11:15:30 来源:商业新知网
文/VR陀螺 万里
【资料图】
“我非常相信AR。它可以增强我们正在进行的对话,增强学习能力,并真正放大技术与人的价值。”库克曾不止一次提到了对于AR技术的喜爱。
不过,当苹果在WWDC期间端出一款重达一磅的头显产品Vision Pro之后,无形之中又唤起了某些人对于《黑客帝国》般赛博朋克世界的恐惧。AR/VR将成为下一代计算平台已经逐渐成为大家的共识,但是,Humane提出了反对意见。
扎克伯格在三星S7发布会,图源:网络
Humane是一家由Imran Chaudhri和Bethany Bongiorno共同创办的科技企业,企业成立于2018年,致力于“打造首个专为AI构建的软件平台和消费级终端产品。”
谈到Imran Chaudhri和Bethany Bongiorno,这两个人其实大有来头,其中Chaudhri于1995年加入苹果,曾担任苹果人机交互界面团队的设计总监,此外,他也是初代iPhone项目核心6人团的成员之一。维基百科指出,Chaudhri在苹果期间曾参与了macOS外观的更新工作,并致力于为智能手机构建一个以触摸为交互的全新用户界面。而Bongiorno也曾担任苹果操作系统的主管。
Bongiorno和Chaudhri,图源:Humane
企业发展过程中,Humane吸收了不少苹果的前员工,如其首席技术官Patrick Gates曾担任苹果高级工程总监。有消息透露,目前Humane团队成员约两百人,其中有苹果背景的就占了半数。
无论是对外采访,又或者社交平台发声,Chaudhri曾多次表达了对于VR/AR产品的质疑。在他看来,这类产品跟智能手机类似,只不过把生活中已有的屏幕搬到了离眼球几毫米的位置,它不但具有更强的侵入性,同时也形成了用户跟世界之间的一道壁垒。
Chaudhri对于VR/AR看法,图源:TED
不仅如此,Chaudhri在2018年接受Fast Company对话时也曾提到,他之所以会选择离开苹果,原因之一在于个人道德与企业决策并非始终能保持一致,一个典型的例子在于他知道手机最大的缺陷在于能够分散和垄断用户的注意力,但苹果却故意没有为用户提供足够的工具来维持对设备的控制权。从这些方面不难看到,在产品理念或者对于未来新一代计算平台看法上,Humane跟其他一众AR/VR企业其实持有很大的差异。
Humane团队很少提及VR/AR相关技术,Chaudhri透露团队目前试图构建的产品以及平台体验有三大特性:Screenless(无屏幕的)、Seamless(无缝的)和Sensing(可感知的),而平台将由AI、计算机视觉、机器学习作为三大核心技术支撑。
Chaudhri演讲,图源:TED
Humane发展5年间,共计获得了2.3亿美元的融资。其中最近一次1亿美元的C轮融资发生在今年3月,投资者阵营堪称豪华,其中包括SK Networks、微软、LG Technology Ventures、沃尔沃汽车技术基金、Qualcomm Ventures以及OpenAI创始人Sam Altman等一众知名企业或创投机构。
苹果团队背景+超前的产品理念+出色的融资表现,Humane很难不引起大家的关注:未来它将推出什么样的产品,而“无屏幕”的产品又如何与未来的AR相抗衡?
近日,Humane对外公布了其首款产品的部分细节。该产品命名为Humane Ai Pin,官网指出这是一款“新型的独立设备,其软件平台利用AI的力量来实现创新的个人计算体验。”产品由高通与Humane合作开发,并搭载了高通的Snapdragon平台。
高通业务开发副总裁Dev Singh表示,Ai Pin外形时尚并且具备强大的性能,它可提供卓越的AI体验,可实时理解上下文信息等。
目前这款产品尚未发售,不过Humane承诺这款产品会在今年晚些时候正式推出,加入候补名单的用户可获得产品的优先访问权。
Ai Pin,图源:Humane
功能方面,Ai Pin在今年4月的TED演讲期间做了一个简短的产品演示。从下图可以看到,这是一款挂在胸前的可穿戴式设备,它配备了相机、动态指示灯等模组。这款产品并没有配备常规的屏幕,主要依靠语音进行交互。此外,它还配备了一个投影模组,可以把信息投影到手掌、桌面等环境中。
图源:TED
Chaudhri当时在现场演示了Ai Pin的几项功能:
来电时,设备会发出声音提醒,用户把手举到胸前即可查看投射过来的信息。投射颜色为单色,可显示来电用户、通话时长、通话录音等;
点击设备按钮,用户可用语音向设备询问去哪里购买礼物等问题,而AI助手会给出合理的答复;
在出国旅行等语言不通的场景下,设备可快速将用户的讲话内容输出为当地语言,并且AI技术能够很好还原说话者的音色以及语气;
可用语音向设备咨询未来的日程安排;
把食物放在设备面前,设备可检测食物的热量、成分并提供相应的饮食建议。
图源:TED
从现场演示来看,Ai Pin主要能起到电子助理一类的角色,并且AI具有联系上下文的能力,比常见的语音助手要更加智能。
2020年,Humane发布了一份名为“具有激光投影系统的可穿戴多媒体设备和云计算平台”的专利,专利文件揭示了这款产品可能具备的更多功能以及特性。
硬件方面,这款设备搭载了一颗180°FOV具备OIS光学防抖的摄像头、一颗3D摄像头以及深度传感器,这些传感器可用于检测环境物体、识别用户手势等。
可识别路人的穿着打扮,图源:Humane
设备采用高通系列芯片、并配备X55基带、GPS、惯性传感器、心率传感器和指纹监视器等,这意味着它可以独立进行工作,并不需要依赖于连接智能手机。设备配备了一个外置电池组,电池组通过磁吸连接的方式对设备进行无线供电,而通过磁吸力可以起到把设备固定在衣服上的效果。
专利文件中指出,借助设备的激光投影系统,可将任何表面变成显示器。除了前面所提到的接听电话以外,用户还可以将时间/日期、数字键盘、温度调节开关等信息投射到手掌,用户可以点击投影内容进行操作。
图源:Humane
此外,专利文件中还提到了几种具体的应用场景:
手指指向附近的建筑并询问“那是什么建筑?”云计算平台会根据空中手势来缩小摄像头检测范围并且框选出建筑物本体;
设备能够以最少的用户交互记录用户的生活场景,图片视频等数据会上传到云计算平台并进行自动编辑和优化,然后提供给用户在各种设备上播放。这应该类似于iPhone的相册回忆功能。
Humane正在着手于构建第三方应用生态,其中包括个人直播、监控(确保亲人已经服药)以及个人行程指南等。
当然专利中提到的产品功能或者结构并不一定会在量产产品中呈现,更多信息有待产品正式发布时揭晓。
图源:Humane
2020年,Bongiorno和Chaudhri接受《WIRED》杂志采访时指出,“未来当计算界面完全消失时,我们将会回归人性”。无可否认Humane打造的产品以及所进行的一系列尝试的确很容易勾起我们对于未来的美好幻想:未来的科技可能会退居到幕后,召之即来挥之即去,成为一种更近乎阳光雨露般无形的存在。
不过,从产品层面来看,如果Ai Pin想要从AI切入来定义下一代计算范式,其实并不简单,它需要面临显示以及交互两大问题。
陀螺君了解到,Ai Pin很可能采用了LBS投影方案,LBS技术可以生成免对焦图像,并且在体积控制方面相较于其他投影方案也有明显优势。
在TED演示过程中,虽然投影文字看起来清晰明亮,但它能否在高亮度的户外场景下使用仍需打一个问号。此外,由于Ai Pin需要以手作为投影幕布,而人类皮肤具有吸收性、光致变色性、荧光性和较高次表面散射性等特性,并非一个理想的投影介质,这个过程中需要考虑画面扭曲等问题。
图源:TED
在一份名为“可穿戴多媒体设备的动态光学投影”的专利文件中,Humane提到了解决图像畸变问题的办法:设备可通过激光雷达、TOF等传感器来检测投影表面的动态3D变化,然后对投影图像进行预畸变处理以减少2D头像投影到3D表面的失真效果。
图源:Humane
从现场演示来看,Ai Pin投影的FOV很小,并且画面精细度一般,这意味着它只能用于显示简单的图标以及文字信息,而难以进行观看相册、观影、浏览网页等常规操作,这可能是用投影取代屏幕的重要弊端之一。
专利信息,图源:Humane
交互方面,这款产品以语音为核心,但有数据表明,正常朗读语速为每分钟两百字左右,而一般人的阅读速度平均为300至500字/分钟,也就是说,在浏览邮件或者文本信息等情况下,相较于语音播报,视觉其实更为高效。
其次,还有一项研究指出,98%的受访iPhone用户都表示用过Siri,但是,这里面仅有3%的人会在公共场合或其他人面前使用语音助手(Creative Strategies,2016年)。想必Ai Pin未来同样会面临这种在公共场所使用的困境。
Humane曾在其新闻稿中如此写道:我们坚信技术应该为人类服务,而不是相反。Humane是一家利用技术行善的体验公司,而不是一家寻找充分理由体验技术的技术公司。
虽然Humane理念很前卫,但它却有可能会因为过度追求“技术无感化”最终反过来加重用户的使用成本。不过,陀螺君仍希望Humane能越走越远,为了未来的可能性。
关键词:
据张迪煊在会上介绍,通过过去一年努力,异腾AI产业快速发展,生态蓬勃
该法案的一个突出特点是注重基于风险来制定监管制度,以平衡人工智能的
7月4日晚,2023全球数字经济大会在北京国家会议中心开幕。
度量轨迹间的相似性不仅是一项基础的研究问题,同时也为众多轨迹数据挖
江苏有线消息显示,根据国网固话业务整体工作要求,江苏有线信息化管理