文字对比视频，语音来说，包含的信息量到底是更大还是小得多？

查看相关话题

Andrew Tate

2024-11-20T13:12:51+00:00

我看两种观点都有很多人支持。

blew.

信息量和数据量是两回事
视频和音频的数据中存在大量冗余的信息，对于传递信息来说是低效甚至无效的
在相同数据量下，文字所承载的信息量是最大的

Grodd

你先说好怎么比，是一句话对一张照片，还是一M的文字，对一M的图片

VOID

我觉得就信息量来说，同一时间(不太适合，但我一时也想不出来三者可以比较的量级)的视频信息量肯定是多的。但是作品首先需要被作者产出来，文字和音频作品产出更容易，因此作者同样的精力可以在文字和音频中产出更多内容，而且就我个人来说，我觉得读书和听播客获得有价值信息的概率远高于看视频。

Coktor

语音效率最低，视频信息量最大，文字便于记录回顾

GiftyFTW

看具体情况。譬如美景，那就是视频这种有视觉呈现的信息量最大。譬如攻略，有些时候就是文字这种方式更好，把视频里的水都抽干了，一目了然。至于语音……语音不是包含在视频里吗？被视频完爆了。

alexxx

1. 视频的信息量最大
高数据密度：视频是图像和声音的结合，每秒通常包含24到60帧的图像，每帧可能包含数百万个像素，每个像素又有多种颜色通道。这意味着单位时间内的视频信息量远远超过文字或语音。
多模态信息：视频不仅传递视觉信息，还可以包含语音、文字字幕、背景声音等多重信息。
带宽需求高：视频文件的大小通常远远大于纯文字或音频文件，反映了其包含更多的信息。

2. 语音的信息量居中
时间连续性：语音以波形的形式存在，包含频率、音调、语速、语调、节奏等多个维度的信息。这使得语音的单位时间信息量高于文字。
背景信息：语音可以传递情感、语气和环境背景，例如说话者的情绪、身份和背景噪音等。
语速限制：人类语速通常是每分钟150到200个单词，相比文字，语音的信息传递效率有限。

3. 文字的信息量最小
符号化表达：文字是信息的高度提炼和压缩，通常丢失了语气、表情和视觉信息。这种符号化形式降低了信息密度。
低冗余：相较于视频和语音，文字中的冗余较少。例如，“我很高兴”这三个字传递的信息量，比一个人微笑的视频或带有兴奋语气的语音要少得多。
可扩展性强：虽然单个字符或单词的信息量较低，但文字可以通过组合扩展信息深度，因此在特定情境下可能更适合传递复杂的概念。

具体案例分析

以描述一个笑容为例：

视频：不仅可以展示脸部细节，还可以捕捉到动作、背景、声音等相关信息。
语音：可能用“哈哈哈”或“愉快的语调”来表达，但视觉细节丢失。
文字：或许只能用“他笑了”来表述，信息密度最低。

如果以香农的信息熵公式衡量：

视频需要的比特率最高(典型的高清60fps视频约为5Mbps甚至更高)。
语音其次(典型的语音采样率为16kHz，每秒约256kbps)。
文字最小(按每个字符8位计算，每秒钟最多只有几千比特)。

总结
从信息论的角度，视频 > 语音 > 文字。但信息量的大小并不等于信息的有效性或价值。具体应用中需要根据场景选择合适的媒介，例如复杂叙事适合文字，情感传递适合语音，视觉冲击适合视频。

Oscar

内容当然是视频多，但是文艺作品很多时候需要的是引发共鸣。
比如大家都说的龙族，很多时候逻辑都是烂掉的，但是在读到某一部分的时候都会引发共鸣，那就是成功的。

比如faker那个经典的输掉比赛后的回眸一瞬，不需要你懂英雄联盟，只要能感受到faker的痛苦，那就行了。

所以说不同的载体追求的目标都是一样的，那就是共情。很难简单的说谁优谁劣。