世界上第一款CD播放器,索尼CDP-101(图)

1872 年的一天,两个年轻人在美国加利福尼亚的一家酒店发生了激烈的争吵。

他们中的一个人认为,奔马的蹄子在它跳跃的那一刻就在空中。另一个人认为,当马奔跑时,一只蹄总是着地。

来自英国的摄影师Cambridge得知此事后,决定进行实验来验证谁对谁错。于是,在24台相机的帮助下,他连续拍摄了24张照片,从而创造了人类历史上第一个“视频”。

很快,在 1877 年,著名的发明家爱迪生录制了《玛丽有一只小羊羔》的歌词,并在他的“圆筒留声机”上大声朗读。

短短几秒的声音,成为了人类历史上的第一个声音。于是,人类正式进入了音视频时代。

█ 音视频技术的发展与演变

众所周知,人类有五种感官,即视觉、听觉、嗅觉、味觉和触觉。通过五种感官,我们可以感知外部物质世界的存在,享受现实生活的美好。

在人类漫长的历史中,文字和图片是记录和传递信息的主要方式。直到上述音视频的出现,人类记录信息的方式才升级到更高维度、更具体。

在音像的早期,它们只能存储在胶片和磁带上,容量有限,存储和运输不便。

电影片段

直到1970年代和1980年代,随着数字录音和摄影技术的不断成熟,唱片公司和电影公司开始使用数字方式记录原始资料和后期制作,掀起了音视频技术的创新浪潮.

在数字技术的支持下,音视频编辑变得更加方便快捷。 CD、MD、DVD等数字载体的出现,不仅极大地提高了音质和画质,而且极大地扩大了存储容量,减少了空间占用。

世界上第一台 CD 播放器,索尼 CDP-101(1982 年)

1990年代,个人PC的广泛普及和互联网的爆炸式发展,再次刺激了音视频技术的飞跃,将人类推入了多媒体时代。

在那个时期,互联网的祖先疯狂地上传和下载mp3、wav格式的音乐,bmp和jpg格式的图片,以及rm、mov、avi格式的电影。他们不再局限于单纯的文字交互,而是转向了QQ、MSN等多媒体交流工具。

同时,以音视频技术为基础发展起来的游戏产业,将人们对数字世界的感官体验推向了更高的层次。人们开始对数字虚拟空间中的生活产生了早期的憧憬和迷恋。

模拟人生游戏截图

进入 21 世纪后,随着 3G/4G 和光纤宽带的快速发展,以及摩尔定律下 CPU、内存、硬盘能力的进一步提升,影音技术取得了突破,可以可以说是日新月异。

以视频的清晰度为例,一路从前期的标清(320p/480p),到高清(720P/1080P),再到超高清(4K/8K),最后给出诞生了前所未有的人机交互模式——VR/AR(虚拟现实/增强现实)。

VR/AR 的出现是人类第一次感受到沉浸式体验是什么。我们与数字世界的交互已经从单向异步变为双向同步。我们朝着真正的数字空间迈出了一大步。

2020年,腾讯提出“全真互联网”。 2021年,元界将无处不在。这些都是音视频技术飞速发展的产物。

视频编解码技术的不断演进和信息通信技术的快速迭代,极大地提升了人们的视频观看体验,彻底激发了人们对平行数字空间的渴望和向往,这是一个可以实现的梦想.

人们不再满足于使用音视频技术来传输现实世界的图像,而是更希望“捕捉”现实世界的所有元素,将它们转换成无数的比特,存储在硬盘中。这些比特将成为人们构建数字虚拟世界的素材。

█ 音频和视频技术需求的变化

元宇宙是否会成真,我不知道答案。但是,音视频技术的需求趋势是明显的。总结起来就是两点:平民化和工业化。

近年来,智能手机的普及和专业视频录制设备的降价,为越来越多的普通用户提供了创作和制作音视频内容的机会。

短视频业务的爆发和直播的兴起,将视频的普及推向了新的高潮。

网红直播带货

几乎一夜之间,我们进入了“人人看视频,人人拍视频”的时代。许多优秀的up主或主播可以通过优质的内容赚取巨额利润,激发了人们对视频谋生的热情。

在这种情况下,音视频技术需要进一步降低门槛,让更多的人更容易制作内容。

2020年,突如其来的新冠疫情也间接推动了音视频行业的发展。我们需要利用虚拟空间的扩展来弥补疫情对物理空间的限制。

学生在家学习,公司在家工作,为在线课程和会议产生了大量的视频流量。据运营商统计,截至2020年底,视频占全网数据流量的近70%。

远程会议

除了学习和办公,业界拓展了视频的应用,发现了更多创新场景。

例如,借助视频识别技术,可以对产品进行质量检测,对公园内的车辆进行管理,对建筑工地的安全隐患进行识别。

图片[1]-世界上第一款CD播放器,索尼CDP-101(图)-老王博客

再比如,借助VR/AR技术,可以对人员进行岗前培训,进行远程手术,进行远程访问,进行远程设备检查和故障排除。

换句话说,视频不再只是一种娱乐工具,而是一种生产力工具。

各个领域和垂直行业都希望利用音视频技术对现有的生产场景进行升级改造,提高效率,降低成本。

企业希望充分利用音视频技术,但也面临技术门槛和资源投入的顾虑,望而却步。

我们每天都在讨论数字化转型。事实上,“音视频+垂直行业”是企业数字化转型的绝佳入口。音视频行业即将进入爆发期。

█ 音视频技术的未来方向

我刚才说的是外部需求的变化。接下来,我们看看音频和视频技术如何应对变化。

简单来说就是三点:终极算法、智能功能、服务平台。

音视频的性能指标有所提升,前进的步伐并未停止。

尤其在视频方面,由于高清显示技术的驱动,视频的分辨率不断提高。除了分辨率,对视频帧率的要求也越来越高。

还有VR视频,因为包含三维时空信息,所以冗余度更高,数据量更大。

要实现超高清高帧和VR/AR视频应用的普及,仅仅增加硬盘容量和通信带宽是不够的,还必须尽可能压缩视频量这与视频压缩算法的不断完善是分不开的。

目前,全球视频编码标准有几个派别。除了大家熟悉的H.26X系列(ITU-T主导),还有MPEG系列(ISO/IEC主导)、AVS系列(国内AVS组织主导)、免费开源的AV1。

来自知乎用户:甜草莓

这些标准形成了开放的竞争关系,不断探索视频算法的极限。它们是视频技术向前发展的基础。

除了硬指标的提升,音视频的另一个发展趋势是综合智能时代的到来。

也就是说,AI人工智能技术正在不断被引入音视频领域音频信号主要物理参数有,帮助提高音视频内容的制作效率,同时创新更多的播放方式。

先看音频。

AI+Audio可以实现音频信号的智能识别和编辑。具体的识别对象可以是鼓点或歌曲中的节奏点。

AI 可以根据音乐的强度、情绪、风格、情感等维度来理解和标记音乐。作曲时,AI可以智能分离音乐中的人声、伴奏、吉他、钢琴等音轨。

AI 还可以自动改写歌词,将流行歌曲改编成 Rap(说唱音乐)。

再次观看视频。

做过视频的人都知道,视频内容创作的大部分工作量都集中在视频内容的编辑和渲染上,耗时耗力。

相对于传统的人工剪辑,基于算法和学习,AI可以对视频素材进行“智能增强”和“智能剪辑/条带化”。

“智能增强”是利用AI技术对视频图像进行降噪和色彩增强,改善画面细节,增强人眼的主观效果。

“智能剪辑/分条”是智能识别和分析原始视频素材中人物的动作、事件和表情,自动定位精彩片段,提取,完成剪辑、配乐等工作,转将它们变成精彩的视频收藏。

“AI+Audio+Video”的融合,更百搭。 up master可以借此实现视频智能配乐、音乐MV、vlog的自动创作,大大降低作品的制作难度。

除了内容创作,AI还可用于视频修复(老电影修复)、视频增强、工业视频应用。

如腾讯多媒体实验室,通过对敦煌壁画疾病数据的深度学习,形成一套自动识别和添加图标的算法,打造出高效的AI壁画疾病识别工具。

腾讯与敦煌研究院合作文物VR远程会诊

音视频技术的第三个发展趋势是服务形态平台化。

如前所述,音视频技术的应用难度很大,个人和企业都很难独立发挥。于是,很多音视频技术服务商开始通过视频云(腾讯)、视频中台(中国移动)等方式,向个人和政企用户提供音视频能力。

这些平台集成了开放的API接口,方便上层应用开发者调用和开发软件。平台本身结合​​云端的能力,拥有无限的计算能力,可以支持用户的需求。

专业服务商提供的技术和平台涵盖智能采集、数据处理、渲染显示等多个环节,有利于降低垂直行业音视频业务的发展门槛,让更多企业使用他们冷静。音视频业务,享受音视频红利,加速数字化转型。

█ 结论

现在,没有音视频,人们的幸福就减半了。

未来,没有音视频,企业效率会下降一半。

如前所述,未来音视频技术将进入爆发期。尤其是在工业制造、金融证券、文旅教育等垂直领域音频信号主要物理参数有,音视频将进入高速增长阶段。音视频的商业模式将发生巨大变化。音视频业务的应用场景也将大量出现。

© 版权声明
THE END
喜欢就支持一下吧
点赞0
分享
评论 抢沙发

请登录后发表评论