智谱 AI 输入法

智能 AI 语音输入工具。...

【产品介绍】

小凹语音输入法是一款 AI 驱动的智能语音输入工具,通过语音转文字技术实现高效创作,输入速度比传统打字快 4 倍。

【核心功能】

高精度语音识别:支持中英混输,语音识别准确率达 97.8%,专业术语零损失

多风格转写:提供面向不同对象的表达风格(如老板、同事、伴侣),支持多语言及方言转换

场景化模板:内置记账、请假、工作汇报、会议通知等常用场景模板

智能扩写润色:语音描述后自动生成结构化文档,支持一键扩写和格式优化

全局唤起:可在任意应用中使用,无缝衔接工作流程

【适用人群】

适合创作者、管理者、程序员、销售、HR、教师等需要频繁文字输入的职业人群。

22 个评论

志云

这个good属于是勉励,因为小凹有在迭代优化

1、上次说你送积分抠抠搜搜的,这次你直接送我2,000积分,好感+1 ;但这个买coding套餐送会员这波操作没搞明白,一开始就是个“赠品”定位?还是说要大力发展口喷编程方向咧~

2、这个自动添加词典依旧没搞明白是什么逻辑(图3),采集了一些【有的没的】~这几个字刚才死活转写不出来(图4)?

3、人设这个场景好评,确实也算是创新;但这个预设的老板和同事人设~我真的截图发给他们了,大家都会心一笑;另外为什么没有面对下属的人设呢?我都帮你想好提示词了:以既友善共情又清晰笃定的语气明确工作要求,核心是把工作价值与下属的成长收益、实际回报具象化,让下属看到努力的可见成果,主动认同并全力推进。

4、关于识别率,很飘忽!这篇查评就是小凹输出的,但有将近1/3是我手工修改的。生于智谱最大的桎梏就是你只用这一个模型,但我想要的是最好的效果,双向奔赴不了~

5、还有快捷键,我必须一直摁着FN,这是个很蠢的交互,快点自由说的按钮吧;其他的细节体验比第一个版本好很多了,所以才以兹鼓励

其实最后的结论依然是 不推荐 ,本来打算用够一周的,实在没忍住赶紧换了~

降临派 小明同学

Hello,你的内部定位是 “引流工具” 吗?

The automatic translation feature is pretty good.(自动翻译功能可以,比 typeless 快了一步)

希望这个页面设计能更简洁一些,减少不必要的视觉干扰,让我们能更专注于核心内容。(职场人设)

(尖叫)(扭曲)(阴暗爬行) 页面上引流广告,让我不自觉进入疯狂比较模式 ?✨???(发疯文学)

#页面…… 不…… 清爽,低音量的时候…… 有时候 识别不太清楚……(疯狂动物城闪电侠)

降临派7585

不知道为啥评分会这么低,感觉能用,能识别多种语言,英语那么烂也能识别出来,还是挺厉害的。

还有人设模式,别人说的话,都能翻译出来,比如女朋友的反调,都可以翻译出来??

不过一进页面就要邀请码,不然就给你用三天,或者拿 几百积分去换七天的时间,这点就有点搞不懂,到底是什么样的收费形式。

总体用下来,还算可以的。

just say

门槛设计堪称反用户教科书,登录只是开胃菜,邀请码+积分双保险直接把尝鲜者堵在门外——输入法这种工具型产品搞这套,只能说获客策略还停留在Web3时代。

转写引擎倒是超预期:响应速度进入秒级可用区间,语气词过滤的泛化能力不错,"这个那个嗯嗯啊啊"这类口语冗余清除得干净且自然,没有伤及主干语义。基础能力扎实。

唤醒词机制思路对头,但意图识别拖后腿用特定词区分功能模式,这个设计在语音交互里确实能降低误触率,属于用户可感知的巧思。可惜上下文管理明显翻车,多轮对话后唤醒词失效概率高,意图理解漂移严重,导致功能可用性腰斩。

除翻译模式能正常输出外,其余预设角色(如果存在)感知度为零。看起来像是为差异化而硬凑的功能模块,实际调用率应该非常惨淡。

底层转写技术过关,但产品层被邀请码和积分体系拖累,体验层又败在意图识别稳定性上。有技术、没产品,有想法、没闭环。

乐在其中

今天在降临派平台试了一下。怎么说呢?感觉是:想的挺好的,实际没啥用。给个中评吧

智谱 AI 输入法是一个 100% 语音输入法,所以用户原本的键盘输入法不会被代替,两个可以同时用。相当于是一个语音输入外挂,可以按 fn 键唤起输入,说完之后抬起按键即可开始识别。 几轮测试下来,识别准确率还行,并且也可以让它进行创作(而非输入)。从某种角度来说,确实可以提高内容生产效率。在智谱的战略中,智能 AI 输入法不只是一个输入法,而是下一代人机交互入口。在这种战略远景下,智谱 AI 输入法自然被冠以相当高的期待。不过智谱 AI 输入法有声纹识别,它只会识别你的声音,别人在旁边说话不会识别。(但还有个问题,我发现你不按 fn 键,它也会一直开着麦克风,相当于一直在监听)。

羽伶伶

相比于名字里的智谱,我希望能再质朴一点。

测了一下智谱这个AI语音输入助手,整体体验下来,有好几个点我是非常非常想吐槽?!

首先必须要吐槽的是这个安装,我在官网下好windows安装包,双击之后原本是等它弹个窗口让我选安装路径什么的,结果下一秒应用直接跳出来了。

怎么,是一点自定义安装的机会也不给啊!

打开路径一看,一声不吭,果然直接给我塞C盘里了。

我的C盘空间本就岌岌可危,它愣是往里灌了将近400M,C盘直接雪上加霜(图1)

当然这只是小插曲,打开软件必须得手机号注册登录,结果注册完它竟然给我弹到了一个叫“小凹智能体”的网页上。网站里AI PPT,AI播客,AI视频功能花样看着挺多。

但等等,我不是来测语音输入法的吗?怎么突然给我引流到这么一个还要消耗积分的智能体网站去了?这种强制引流操作,何意味?(图2)

关掉网页回来用这软件,它有一个交互教程,这点做得还行,就是初步教学,让你理解它不仅能听写,还能直接跟AI对话,可以提一些要求。

比如我可以直接语音说“给我做一个北京旅游日程表”,它就能直接输出结果;或者选中一段话让它“翻译成英文”。这时候我才反应过来,原来刚才那个智能体网页端是在后台支持这些功能的。

但我在后续使用时,我才发现它经常会分不清,我到底是想“语音转文字”还是想“跟AI对话”。比如我在录音时说了一句“这块我感觉调整之后有一些问题”,

这里我是想把这句话打上去,结果它理解成我在问它,直接给我蹦出来一堆AI分析:“调整后文本存在以下问题:1.表述不够专业...建议下一步...”

我真的无语,我要的是转录,不是让AI给我结果,这就导致交互变得非常混乱,体验很割裂。

还有一个我觉得算恶性bug的地方,就是我想替换已经打出来的某句话,按理说拖拽选中,然后语音输入,应该新的词句会直接覆盖替换对吧?结果这个压根没一点反应。

这点真的让我挺失望的。之前评测的那个闪电说,它虽然没有这么多花里胡哨的AI联网小功能,但人家基础体验稳啊。

我用语音输入软件是为了减小工作强度,不想打字,结果你连最基本的选中文本替换都做不到,那我用到底图啥?

还有那个所谓的AI润色功能,什么“面对老板”要专业结果导向,“面对伴侣”要温柔体贴。实际用下来,感觉真心不好用。它会把你很多语气词,细节全给删了,导致转录出来的文本严重失真。(图3)

我觉得这本质是给产品做加法做得太多了,反而失去了产品本身的内核。

做语音输入产品,我觉得一定要去轻量化。

为什么闪电说的评价好?不是因为它功能多,而是因为它简单,不失真,方便好用。

但如果连最基础的转录准确性、文本替换的便捷性都保证不了,搞再多花哨的AI功能也是白搭。

我也希望开发者或PM能看到这些反馈,真没必要做那么多加法。

多站在用户角度思考,把产品再优化优化,做做减法吧。

叫俺刺头

我感觉智普(这两个字识别错了,是这款输入法给我输出的)的这款AI输入法相对来说能满足我的基本需求是我给good的原因

从功能上来说:

他会把我说的一些话转成直接输出,不会进行一些总结和润色,整体的速度相对来说也比较快

内置的什么模版,发疯文学,这些操作哈哈哈我没搞懂,就是增加一些符号吗,就代表发疯了

从交互上来说:

有些地方不是很友好,包括他首页的这个如果我误触了一下fn的话,它每次都会生成一条记录,我觉得这条记录对于用户来说没有任何意义而且就是他首页首屏的这个识别语音的记录,他的滚动的区域只有这么一小点儿,而用户常看的应该就是这些记录吧,但是他却把一些什么提效的时间啥的放的那么大,我又不会看他给我提效了多少(就像淘宝会员今年省了多少钱,淘宝会给我一直放首页吗,还那么大)

还有一点我想说,它的介绍里面说这款产品的一些用户是针对于销售的,但是对于销售来说,会经常出差在外面或者是在路上,个人觉得移动端更是他们的使用场景

落叶

别过得(我说的是给个Good)稍微鼓励一下吧,其实从个人的体验感受来说的确是远不如闪电说的,但是看了下目前的评分只有0.8好像也不至于差到这个地步?

补充一下,这篇评论完全是使用智普(智谱,自家产品名居然没收录也是有点离谱)的小凹输入法写的,如果有转述不对的地方我也会标注一下,也比较真实地能够反映出这个输入法转述的能力

(这里漏掉了“首先”)的确也像大家所表达的这样,这个注册流程确实有点让人摸不着头脑。明明是一个输入法产品,然后登录的时候还强行引到了AutoGLM的智能体网站上,还需要邀请码加积分兑换的方式来兑换使用天数的权限。的确不是很理解,因为输入法其实是一个特别基础的产品软件,从用户限制(这里说的是心智)的角度上讲,搞这么一套复杂的流程,而且还有使用限制,确实不太容易接受。

(这里漏掉了“产品功能”几个字,可能按完就说了,没反应过来?)客观来讲算是中规中矩吧,因为语义(语音)的转写包括输出的速度还是比较快的,而且也会自动删掉一些语气词,包括一些比较容易(冗余)的文字。

能感受到可能是为了跟竞对做出一些差异化吧,也增加了一些看起来有意思的功能,但是实际上体验下来好像没什么用,就比如说我截图里放的这个人设的一些设定,不仅没有起到应有的效果,还让我对于智普(智谱)本身模型的能力有了一些质疑,因为最后输出的效果和这个原始提示词之间的指令遵循有点过于死板了,对于现在这个阶段的大模型水平来说实在是不太应该。

(确定了,从按下到开始录之间就是有1秒左右的延迟,这里又没录到前几个字“不知道”,感觉这个体验不太好)智普(智谱)是不是过于把精力放在B端和G端了,就是C端的这个用户体验确实还有比较大的优化空间。比如说这个积分的明细也有点让人想吐槽,在完全没有告知用货(用户)的情况下,登录送300积分,然后直接就用这三百去扣了三天的使用权,就好像是说我给你发了个红包,然后马上告诉你哎我逗你玩儿。这种对于新用户来讲就完全不如直接说我给你免费3天的使用。

智普(智谱)的模型能力我倒是没有什么怀疑,希望他们继续优化一下这个东西的体验吧

glq

以下的评论原本计划使用智谱AI输入法写,但最终还需要手动调整,最后还是用了typeless。

到目前,AI输入法主要用了三类:Typeless、智谱和之前的闪电输入。但试用完之后,感觉智谱作为一个大厂,并且是一个收费的,整体来说感觉不如其他两个。主要原因有以下几个方面:

1. 下载完APP登录后,直接就让输入邀请码,但邀请码根本没有地方获得。结果下方只有一个小的三天试用选项,并且还可以拿积分去兑换使用。我觉得不用直接把邀请码放在第一位,这个给人的第一感觉很不好。

2. 它没有做口语到书面的转化,而且里面有很多识别不准确的地方。比如在对话中说到“123”,其他的输入法更多会转向“Typeless”(转成序号),但智谱的这个基本上没有什么转换。

3. 识别的准确率感觉没有说的那么高,尤其是中英文结合的场景,有些基本识别不到。比如智能体工作中的agent workflow,有些就会识别出错。

4. 它唯一做得比较好的就是可以通过小凹(一个功能),然后直接调智谱的大模型,去做一个生成式的文字。但是这个功能是否有很大的应用场景,感觉还需要再考虑。

第三个火枪手

综合评价效果上相较于闪电说有一点点提升,但是由于是付费产品,所以远不如闪电说

本回答全部用智谱输入法进行输入,除了添加必要的换行,没有任何人工修改

首先综合体验下来,我觉得智谱输入法在语义理解上还是很到位的,很多信息不需要依赖AI的修正,它可以直接利用模型本身的知识去做推测,比如我们可以挑一些中英文混杂场景Transformer backbone CNN,那比如说一些领域词,比如说神经辐射场,巨生智能,AI agent coding,我觉得这一点是得益于这是一个audio to text的小的语言模型,所以说它本身就具备一些语义理解能力,这个是很棒。但是话说回来,闪电说的后端AI修正模型是可以匹配的,你也可以自定义词典,而且也可以自己修改提示词,所以说理论上来说,闪电说搭配好的提示词和模型能达到的上限也很高

虽然说模型本身不错,但是这个产品我个人觉得很一般。首先就是这个语音识别是必须要联网的,这一点跟闪电说就有区别。有时候在弱网条件下其实体验就非常差。而且其实这个东西的延迟也会比闪电说用的模型高一点,输入的体验没有那么丝滑。比如你会看到当你输入的时候,它下方会有一个滚动条,它就一卡,卡一卡的其实不如不展示。

然后他还有一个比较花里胡哨的角色设定功能,但是我个人尝试下来觉得是作用有限,比如命令行大神,你用语言,你用自然语言就可以创建命令行的指令,然后这个确实很方便,但是我实测下来当你使用显示的时候,它就可以生成指令,但如果你查看或者展示的时候它就不行,这可能是跟提示词有关系。还有就是不同角色的设定,这个其实没什么实际作用

最后看一个幽默瞬间,请看VCR