语言速率
语言是人类之间交流信息的主要媒介。语言传输的速率限制了个人学习及集体合作的效率。在此粗略测量自己用各种方式输入输出中英语言的速率,并探讨各方式的适用场景。
测试用的文本是比较语言学的经典语料《北风与太阳》,出自《伊索寓言》。原文附在最后。中文版136字,英文版113词。
用时 (秒) | 英文速度 (词/分) | 中文速度 (字/分) | |
---|---|---|---|
阅读 (中) | 8 | - | 1020 |
阅读 (英) | 12 | 565 | - |
朗读 (中) | 37 | - | 221 |
朗读 (英) | 38 | 178 | - |
打字 (电脑 微软拼音双拼) | 82 | - | 100 |
打字 (电脑 英) | 97 | 70 | - |
打字 (手机 Gboard双拼) | 140 | - | 58 |
手写 (中) | 188 | - | 43 |
手写 (英) | 195 | 35 | - |
打字 (手机 Gboard英) | 195 | 35 | - |
Language is an imperfect, incomplete, and low-bandwidth serialization protocol for the internal data structures we call thoughts. (Yann LeCun, 2021)
研究显示,61种语言里的《北风与太阳》平均词数为 65.21 ± 8.73 (mean ± std),朗读速度为 2.07 ± 0.30 词/秒,各语言平均每词提供 6.84 ± 0.50 比特的信息,即信息速率为 14.15 ± 2.26 b/s。
请注意这里的单位不是kb、Mb、Gb每秒,而是卑微的b每秒。这个数字与数码设备的带宽相比低得惊人。刘慈欣曾在小说《乡村教师》里借高智能外星人的视角,感叹人类竟能在如此低的交流速率下建立起发达文明。(他给出的数字是1至10比特每秒,大致准确。)
既然带宽低,那么日常生活中输入和输出语言的时候,可以根据场景选择不同的传输方式,以提高效率。
就输入而言(从外界到人脑),阅读快于朗读,意味着自己看比听人讲更高效。近年来流行的谈话类视频及播客在信息传输速率上不如其文字稿,更不如专门编写的文章。文本还支持略读、便于检索,越来越强的语言模型进一步提升了选择性获取信息的效率。当然,较高的传输速率也需要较高的认知资源。读文章大概比听播客更要求专注。另外,有些信息无法通过文本表达,比如谈话者的表情、语气等。总之,具体形式的选择取决于内容、目的、约束条件。需要预先知道接收的信息里面哪些是想要分析的信号,哪些可以被省略或压缩,以及是否有足够的时间和注意力。
就输出而言(从人脑到外界),朗读快于打字,意味着语音转文字可以比打字更高效。有人说,动作是人类输出语言的唯一方式。这听起来很有道理——要么动嘴,要么动手。前者显然更快更自然,后者是不得已而为之。人类在大概十万年前开始口头交流,五千年前开始书写,而打字不过是近两百年的事情。将语言编码再用手操作按键,是人被迫适应机器,而理想的人机交互是机器适应人。如今语音识别算法的准确率已相当高。只要所处环境允许讲话,不妨多使用语音输入。
上述分析不禁令人怀疑传统教学模式的效率。假设内容相同,阅读课本比听老师讲更高效,且学生可根据自身情况调节速度和顺序。(这不代表完全自学,而是辅以其他交互方式如讨论和答疑。)在课堂上记笔记的效率就更低了,一边听讲一边书写还分散注意力。重要的内容书上不应该都有吗?如果没有,那就是课本的失败。
还有作业。上面测试中手写速度近乎最慢,在字迹潦草的情况下才和手机打字速度接近。工整书写就更慢。(使用毛笔的古人不知要慢到什么程度。)如果目的在于背诵,中小学作业里常见的「抄写」任务或许不如多读几遍更有效。
须注意,本文讨论的是用什么动作才能更高效地传递特定信息。但很多时候瓶颈不在于传输媒介,而在于信息处理,即思考。交谈中的停顿不是因为嘴累了,而是没想好;文章写不出不是因为打字慢,而是没思路;学习进度慢不是因为老师说话慢或自己读书慢,而是不理解。本文无意讨论这个更深入的问题,暂且提供一个思路:假设特定信息可以在不同形式之间转换(无损或有损),那么某种形式可能比其他形式更易于理解。比如直观的几何动画和抽象的代数证明。如何找到最适合的形式来传达情感、交流想法、增进理解,是信息的发出者和接收者共同面临的问题。
备注
本人阅读英文比中文慢不少。第二语言比第一语言慢毫不奇怪,但个人猜测这还跟眼睛注视点移动速度有关。在页面上显示相同的内容,中文比英文篇幅更短,单位面积下信息量更大,眼睛注视点移动更慢。如果习惯于这种眼动速度,阅读英文就更慢。适当提高眼动速度,或许能提高英文阅读速度而不影响理解。
「动作是人类输出语言的唯一方式」,过去如此,今后未必。肌肉的运动由来自大脑的神经信号控制,而这些信号可被脑机接口读取。近年侵入式脑机接口研究[1][2]实现了每分钟60-80词的解码速率以及约75%的词准确率。
King-of-Infinite-Space/whisper-writer-fork 我近来使用的语音转文字程序,调用Groq提供的Whisper Large v3 Turbo模型,比Windows自带的语音输入更准确。
问LLM (DeepSeek-V3) 对本文有何补充,得知心理学里的production effect,比如朗读比默读更有助于记忆。具体可见这篇review。
附录
The North Wind and the Sun - Wikipedia
113 words, 473 characters (excluding space & punctuations)The North Wind and the Sun were disputing which was the stronger, when a traveler came along wrapped in a warm cloak. They agreed that the one who first succeeded in making the traveler take his cloak off should be considered stronger than the other. Then the North Wind blew as hard as he could, but the more he blew the more closely did the traveler fold his cloak around him; and at last the North Wind gave up the attempt. Then the Sun shined out warmly, and immediately the traveler took off his cloak. And so the North Wind was obliged to confess that the Sun was the stronger of the two.
北风与太阳 - 维基百科
136字(结巴分词给出的结果是85词)有一次,北风和太阳正在争论谁比较有本事。他们正好看到有个人走过,那个人穿着一件斗篷。他们就说了,谁可以让那个人脱掉那件斗篷,就算谁比较有本事。于是,北风就拼命地吹。怎料,他吹得越厉害,那个人就越是用斗篷包紧自己。最后,北风没办法,只好放弃。接着,太阳出来晒了一下,那个人就立刻把斗篷脱掉了。于是,北风只好认输了。
电脑上的打字测试使用的网站是
https://typinggo.com/custom-typing-test.html