Uploads%2farticles%2f16188%2fhan s tech talk   plaud note ai voice recorder  powered by chatgpt
|
2023-09-15

吸在 iPhone 背后的卡片录音机,还有 ChatGPT 做贴身助理

全球首个 ChatGPT 的录音设备,是如何在卷的要死的录音笔市场,实现溢价并打响出海第一仗的?

在 ChatGPT 带动的 AGI 新热潮中,智能音箱、智能手表、智能眼镜、再到自行车、新能源汽车等等,陆续成为 AI 的热门终端入口。

最近,我们发现在录音机/录音笔市场,也迎来了搭载 ChatGPT 的产品——PLAUD NOTE,在 Kickstarter 和 Indiegogo 两大众筹平台上成绩一路狂飙。

它被定义为「全球首款 ChatGPT 提供支持的录音机」,用于会议录音、iPhone 通话录音、语音备忘录、以及录音转写。基于 ChatGPT 的逻辑分析能力,它还能提炼会议记录、思维导图、待办事项。

nq7bypqvkkvmjfp7a74v

过去我们曾介绍过国内 AI 公司如科大讯飞以耳机为载体,将大语言模型的能力用于将会议内容提炼出待办事项、摘要总结。看起来 PLAUD NOTE 在海外上市,依靠 ChatGPT 实现上述能力,其逻辑如出一辙。

但 PLAUD NOTE 也有它的不同,首先是硬件载体不同,这就决定了它可以施展的空间不同,我们细细看一下。

录音系统:三麦克风双拾音系统,楼氏、声加技术加持

既然是录音机,我们首先介绍一下它的录音系统。

PLAUD NOTE 集成了全球首个双拾音系统,机身有三个麦克风,其中两个是用于拾取外部环境音的空气传导传感器,另外一个麦克风是振动传导传感器(VCS)。

mic-plaud note (1)

两种传感器对应了 PLAUD NOTE 的两种工作模式:普通录音模式和通话录音模式。

录音模式

普通录音模式和大部分的录音设备相似,借由空气传导器捕获声音,可应用于普通的会议、通话、语音备忘等场景。

通常模式

△ 素材来源:OSReviews

通话录音的实现则颇为巧妙,这里我们重点介绍一下。

通常情况下,要想录制手机内的通话声音,需要手机安装经过授权的应用、或者直接通过外放声音的方式录取。

PLAUD NOTE 借由一个振动传导传感器,捕获通话时音频发出的振动完成录音。

作为一款独立设备,PLAUD NOTE 不经由手机就能完成通话录音,并且这个功能对于 Facetime、WhatsApp、Zoom、Skype 等网络通话也一样适用。

Introducing PLAUD NOTE- ChatGPT Empowered AI Voice Recorder-0001

但是这样的设计也有局限,振动传导传感器的工作机制决定了 PLAUD NOTE 必须与手机紧贴使用。并且,录音时不能佩戴着耳机,即便在开启手机外放的情况下也需要贴合才能录音(当然,手机外放时可以使用普通录音模式)。

在配置方案上,PLAUD NOTE 并不含糊,两个高端 Knowles Sisonic 麦克风,能提供高达 1536kbps 码率的媲美 DVD 音质的声音。

内部

算法方案则由声加科技支持,其 AI 降噪方案 SVE(Soundplus Voice Enhancement)能够支持 25db+ 的噪声抑制,并保留高频音的细节,从而保证良好的声音体验。

文字处理:ChatGPT 加持,转录、总结、思维导图样样不落

正如开篇所言,ChatGPT 的加持是这款录音机的核心亮点。PLAUD NOTE 支持三种文字处理流程。

1. 转录

借由 OpenAI Whisper 的先进算法,PLAUD NOTE 的应用可以将录音精准转录为与人类翻译水平相当的文本,而且还能为其打好时间轴,这不仅保证了翻译的精准度,也能将错误和遗漏降至最低。

转录

2. 自动总结

厌倦了从大篇幅的信息中找出重点?各类 ChatGPT 应用处理这些信息简直就像小儿科。如果你稍微关注下 ChatGPT 相关的应用,就不难发现高频的一个应用场景就是对各种长篇大论的文稿进行总结。

在 PLAUD NOTE 上,对笔记进行总结,仅需短短数秒,一个条理清晰的总结就跃然眼前。

转录+自动总结

△ 素材来源:InsideWire

3. 结构化内容

如果说自动总结让你在不遗漏信息的同时,能花费最少的时间和精力来获取信息,那么将内容结构化则有助于你进一步进行信息的梳理,从而完成下一步的决策。

PLAUD NOTE 可以将多达 58 种语言的文本内容整理为笔记、思维导图、待办事项、课堂笔记和日记等多种形式。

REVIEW- Plaud Note - ChatGPT Powered AI Voice Recorder - Perfect for Meetings & Lectures

△ 素材来源:OSReviews

内容输出形式固然可以满足个性化的需求,但输出质量如何,还有待于不同个体在不同场景下的尝试。

需要注意的是,以上这些能力需要付费订阅才可使用,PLAUD AI 在众筹期间提供的的订阅费用为 9.9 美元/月。尽管网上有一众提供类似服务的免费工具,但是毕竟 OpenAI 的 API 接口需要付费使用,PLAUD NOTE 的成本定价相较于海外的其他供应商已经算是「良心价」了。而且 PLAUD NOTE 表示后续随着人工智能的发展,成本会有走低的趋势,届时 PLAUD AI 的订阅费用也将适当调整。

yingyong

外观设计:轻薄、简洁,与 iPhone 很搭

最后我们再看一下它的外观设计。

PLAUD NOTE 呈卡片形状,大小与银行卡相当,可以放入 iPhone 的 MagSafe 背夹或者上衣口袋。

看一下参数就知道,它的机身十分轻薄,厚度 0.117 英尺(约 3.57 厘米),绝不会被怀疑是充电宝。

它也很轻盈,铝合金材质,仅有 30 克重量。

对于支持 MagSafe 的 iPhone 机型,PLAUD NOTE 在放入磁吸壳后可以直接吸附在手机背面。

1-magsafe

△ 素材来源:Danny Black

而对于那些不支持 MagSafe 的手机,PLAUD NOTE 也提供了一个类似双面胶的磁吸环配件,用以吸附 PLAUD NOTE 和手机。

2-magsafe

△ 素材来源:Danny Black

交互设计上相当克制,整张卡片,只有顶部有一个按钮和一个滑动式开关,分别用于启动录音和录音模式种切换。

充电采用的则是磁吸式而非插孔,一方面会让背面看起来更简洁,另一方面,与采用 Type-C 接口的设备相比,也让整机的厚度被优化到了极致。

充电

△ 素材来源:Danny Black

PLAUD NOTE 内置了 64GB 存储,可以存储 480 小时录音或者近 240 场会议。电池容量为 400mAh,单次充满电支持 30 小时的连续使用,基本能应对各种场景下的录音需求。

提供了黑色、银色和玫瑰金三种配色选择,此外还有黑色、棕色、绿色和蓝色四种配色的 MagSafe 配件。

MagSafe case

众筹价格为早鸟价 99 美元,支持全球配送,预计将于今年 10 月份开始发货。

湾里小结

PLAUD 将自己定位为「全球领先的 AI 音频硬件品牌」,作为一个新创品牌,有这样的目标还是值得肯定的。

实际上,在 PLAUD NOTE 之前,已经有很多翻译笔产品,PLAUD NOTE 首先在设计上很独特,因此严格意义上它不应该被称作是「录音笔」。

而对比亚马逊上单价几十美金的普通录音笔,PLAUD NOTE 以设计和技术创新实现了溢价。

尤其是 ChatGPT 的加持,让它有了更多的人性化的功能。尽管这些关键功能与付费订阅绑定,但是在习惯了为服务付费的国外群体中,这并不是个大问题。

通过硬件收费、软件增值,这种良好的商业模式近些年已经被越来越多的公司采用,在对盈利模式进行革新的同时,也避免了产品单纯在硬件端打价格生死战,从而忽略软件和服务上给用户带来的体验。

REVIEW-_Plaud_Note_-_ChatGPT_Powered_AI_Voice_Recorder

△ 素材来源:OSReviews

一个月前,PLAUD NOTE 在 Kickstarter 上 50 天众筹获得了 7564 位支持者和 $1,108,181 美元的成绩,随后在 Indiegogo 上上线,截止发稿前(9 月 12 日)已有 8,405 位支持者和 $1,227,835 美元的众筹成绩。


主笔:陈述 / 深圳湾

审校:陈壹零 / 深圳湾

编辑:陈述 / 深圳湾

题图来源:Han's Tech Talk

>>
Back to top btn