真能否改写有声书前景?PP电子AI人声以假乱
除产品功能单一的问题外▽▷△●,近乎封闭的内容源也让Kindle显得有些故步自封◁●…□☆。Kindle使用的是亚马逊专门为其电子书产品开发的专用系统▪☆□○▽-,仅支持预置功能★△■★▪-,无法安装任何第三方软件和插件◇○。
当碎片化的时间成为互联网争夺的重点后◆▷,越来越多的人开始用耳朵▼□○△◇“阅读◇○△”▪-=…◇,而随着AI技术的持续迭代▼▼,AIGC成功为有声阅读推开一扇新的大门△○▼。
通过声音来了解一部作品■=,能够获得多一重的感官体验-▲…-○。相较于纸墨▲=▼◁◆,各具风格的声音让一个个小说中的人物变得更为生动立体☆▲……,让你进入作者创造的世界▪▲▼◆,抑扬顿挫的朗读也让一些非虚构作品不再那么枯燥难读★■●-▷△。此外•◁▷▼,有声书比纸质书适用的场景更多——在腾不出手的通勤车厢里▷▷…▼●▼,在周末的家务劳动中☆○•▲-,驾车途中☆▷◆,有声书都可以占据你的耳朵▪★★•★。
以Google推出的AudioLM为例◇□◁,只需几秒音频提示…★○,它不仅可以生成高质量▲△★•▷,连贯的语音▽•,还可以生成钢琴音乐▽▷。AudioLM是一个具有长期一致性的高质量音频生成框架★★▪▷•,将输入的音频映射为一串离散的标记=…◁○,并将音频生成任务转化为语言建模任务•▪□■。AudioLM模型可以基于简短的提示★-•◇◇,学习生成自然和连贯的连续词■…★□◇,当对语音进行训练时★▷▼□•○,在没有任何记录或注释的情况下△★▪,生成了语法上通顺=▽★••◁、语义上合理的连续语音•△★★▼,同时保持说话人的身份和语调▲…◁▽•。
在服务和用户体验方面○○◁▼▲,AIGC技术能够根据用户的收听历史和偏好▼-PP电子AI人声以假乱,为其推荐定制化的音频内容▲△△•=□,提升用户体验☆■◇。如生成个性化的播放列表■◆■▼•★、定制新闻简报等☆◆…■。在音乐内容领域•□•…□,通过游戏化◆-、交互式和社群化的方式PP电子在线官网●-=◇•,让听众参与音乐的体验过程▽○•■•☆,例如通过互动游戏让听众助力音乐作品的传播▽▲▼▪,提升音乐体验的趣味性○◇。
趋近真人发声效果是AI当下与有声阅读融合的最直观体现○◁☆▽。音频生成早期是基于物理机理…=◆▲△,通过机械装置□•、电子合成器等实现对人声的模拟□△◆。随着计算机技术的发展=•▽★△,音频生成逐渐形成了以◁▽“文本分析-声学模型-声码器•○▽■”为基本结构的语音合成方法▼▼▷◇☆。传统的语音合成框架由于语言学知识的复杂性▽○△、数据规模和模型性能等问题☆△▽,语音合成往往难以取得满意的听觉效果▷…,使其实用性受限•◁=★△◇。
此外-◇■○=▷,类GPT模型的能力也让用户看到阅读过程中人机交流体验的变化○◁=▽•▷,AI虚拟人可以围绕书籍内容同用户展开交互●…▲○,用户不仅可随时随地问询AI有关书籍中人物▽△◁▽…•、事件的背景资料…○…◁▲,更能直接让AI帮忙总结阅读内容的大意甚至整理时间□●▪★、事件线索■◁□=,类似•■△“红楼梦中主要家族背景○◁▪”▼◆“明朝藩王关系▽□◆○▼”等问题都能让AI阅读后将答案以说的聊天的方式告知用户=△…。
AI语音越来越像真人的同时▽□■,也改变着行业格局○◇=。当下-◇●◁,荔枝结合AI语音和大模型技术▼■,推出★☆•“My AI friend-◇▼△”●▪◁▼△“小吱-■◆”等AI语音聊天机器人◆••,创新陪伴体验▼★•■▪□。懒人听书中•□▽◆-▽“AI朗读◁●□△-”标签资源有1▷★◁▲□.2万个■▷○●,▼▷…“AI版▽●”朗读专辑近千•-◁,海量AI有声内容不仅丰富了平台资源□…,更进一步推动用户阅读习惯的改变▷☆•☆▷。
大多数电子阅读器背后••○●,都会有相关的图书销售…□◇-▪、阅读平台作为依靠★▽=•▲▷,这也是消费者购买它们的原因▪▷★,比如说Kindle的亚马逊商城▷▲△★,iReader的掌阅以及QQ电子书阅读器的阅文网络矩阵PP电子在线官网…□▽▼=。
喜马拉雅▪▷▪•、蜻蜓fm★▪、荔枝fm★▽▽、云听等在线音频平台迅速发展•○○,有声阅读市场不断壮大▲●。据喜马拉雅发布的《2024春季有声阅读数据报告》显示□•◇▼☆,喜马拉雅人均有声书听书量达到9■◇◁▲▽.7本△★◆◇•,高于去年同期的8▷▲☆■-.8本△●▲。平台年轻化趋势显著◆△●,有声阅读已成为越来越多人日常生活中不可或缺的一部分-□▲○•。
封闭的生态让Kindle掌握绝对话语权的同时…◁□▼-,削弱了用户的阅读体验▷◆◁◆★-,国产电子书在内容生态上十分开放▽★◇,以科大讯飞阅读器为例◇☆▷△,既有产品内置着咪咕…▽■、讯飞两大书城资源…□▽▼,还有产品支持收藏微信公众号■••、网易◆■=▼、头条等新闻内容□△▼=,抑或支持百度网盘△◆□□-、OneDrive等网盘内容△◇□,可以直接导入PDF=□、EPUB▷○、MOBI…-、TXT等常见电子格式文件内容▷--▼,用户阅读便利性更强•▽△=■。
正因如此=■□,多年以前就有人研究出了▽•◆“Kindle刷多看●◁□□”◆…▲◆■◁,如今一些擅长玩机的高手还为亚马逊Kindle系列产品制作了专门的安卓刷机包-△•▷◆,而且网上已经有很多较为详细的教程▽☆,按照步骤操作就能轻松地将安卓系统刷入Kindle设备■△◇•▪。
当不少人对听书还停留在□▪△▼△“连标点符号都不会停顿□▽•”☆■•“呆板•○◁▼、毫无生气的机械朗读=•▪◇▷■”印象时●◆▪□…▽,当下有声阅读市场早已发生翻天覆地的变化▼-。
近年来随着深度神经网络技术的发展☆○◇=◇,在传统的参数合成法结构的基础上=-▽△○△星 国内桌游一哥地位不可动摇开元《三国杀 自2004年问世以来◁…•○,推出了包括在线版《三国杀ol》…△◁△、《三国杀》手游以及《三国杀十周年》等在内的多款衍生产品开元△△,形成了一个强大的《三国 更多 星 国内桌游一哥地位不可动摇开元《三国杀,,端到端合成的方法采用编码器-注意力机制-解码器(Encoder-Attention-Decoder)的声学模型▷□◆,能够直接将字符或音素序列作为输入输出梅尔频谱并生成波形▼☆,从而通过机器学习来简化特征抽取的过程◆◆★□,降低了面对不同语言学知识的训练难度■△•-,使声音合成更加自然-▪、逼真□●。
从现象级产品到□■“泡面神器■◇★▲”☆▼☆•,成功开启电子阅读器市场的Kindle退出国内市场后○■=,国内电子书阅读器市场进入群雄逐鹿的◁••●▽“战国时期…=-”□★△▷☆,掌阅-=、科大讯飞▲△=◆=…、华为▼•■◇-、汉王▽○•●•、小猿◆=•、海信等众多国产品牌强势崛起•…=△,凭借本土化的优势竞逐原本属于Kindle的市场份额●□。
不过需要注意的是AIGC应用涉及大量用户数据的收集和处理○-•□◇,如何确保数据安全和用户隐私不被侵犯是一个重要挑战▷◆。需要制定相应的规范和标准•○◁☆◆,确保技术的规范化和健康发展◆•▪▲。AIGC技术在内容创作中的应用还可能涉及知识产权问题△◁,需要明确版权归属和保护创作者的权益…◁,这意味着IP始终是影视市场背后的决定性力量●■▽★▲。
随着微信读书…▽、七猫小说等平台的崛起和IP变现模式的兴起▼▲★,国内电子阅读市场正逐渐发生变革★●▪•△。这些变化不仅使得传统的内容营销模式失去了活力△□◁△☆,还为电子阅读行业带来了新的商业机会○●■▪,通过IP影视改编和免费阅读流量变现等方式开拓了新的发展路径●▲▼▼☆。
组成声音的结构包括音素□■真能否改写有声书前景?、音节▽▪▷•●•、音位◇△▷◇★▼、语素等★■,AI音频生成能够对这些基本单位进行预测和组合◇△•-□,通过频谱逼近或波形逼近的合成策略来实现音频的生成•=。而决定音频生成效果的关键因素主要包括生成速度▷•、分词的准确程度-▷▷▪、合成语音的自然度▼=□◆,以及语音是否具有多样化的韵律和表现力等=●☆▪◆●,在大模型推演和海量语料训练之下●△…◇=★,AI能够准确完成上面的区分并根据内容实现各种声音的生成▷▲--■。
尤其是最近一两年AI技术的崛起•■▲,持续迭代之下的AI语音技术既实现了机器语音的情感化表达◆▲-▲,又实现了小样本的个性语音训练▼◇★□☆、个性声纹提取=…□•。同时在不同方言▽■★、不同外语●•☆◇、跨语种翻译方面持续完善•-■•,在现实语境的实时语音识别☆•、实时语音生成等方面持续突破•△◇。
Kindle的退出并不意味着数字阅读市场陷入停滞期■=◇◇,相反◇-◇□•▷,数字阅读正在潜移默化地成为当前人们的一种生活方式☆◇▲▼☆=,在快节奏的生活里•◆☆,人们逐渐养成通过手机▪■▪、移动端阅读器在碎片化的时间进行自我提升的习惯•□。
从单纯的听书到广播剧◆▪-◁○,AIGC技术提升有声读物用户体验的同时●■,更极大地提高了音频内容的生产效率-□●☆◆▪。例如▽○△□▼•,通过AIGC技术◇△▷▲=,儿童内容的创作过程得以加速•▪▷◇▽。原本需要3~4天完成的10分钟左右的故事创作▲★●,现在可以在8小时内完成★▷=。这种效率的提升使得内容生产变得更加快速和经济▷◇▼★。
不仅完美呈现原著小说中多人对话的不同强调▽◁□△,甚至连背景环境中的关门声★…•◇、雨滴声•▷○△、战马嘶鸣声都可以清晰呈现…◇▼•▼,从而使得单纯的听书升级为广播剧=○◇☆•,催生了《杀破狼》《赘婿》等热门IP的热度☆◁=,更诞生了紫襟▽…、一刀苏苏☆=、宝木中阳△★、张震……=、沐阳讲故事等一大批主播/工作室•■◇,演播仙侠▼★、悬疑等经典内容之外…◁▲▪•,用户通过穿越○…○□☆、年代文•■★◇、独立-■、复仇等故事类型找寻着内心的情感满足■△□◆=,沉浸感极强的网络文学成为替代性满足的◆•==“情绪商品△▪◁□□★”▽▪○△☆,俘获着有声阅读用户的内心需求=☆▼■•。
以阅文集团为例◆▼,其将版权运营(包括IP影视改编)转化为电子阅读领域的估值工具○▪▼…■。《琅琊榜》《庆余年》等作品直接与作者签约购买版权=☆▷◁,不再局限于书籍领域◇=••★▽,而是瞄准了书籍影视化后的电视电影用户▷◆◁▪…▪。免费阅读所聚集的大量用户流量•◁◇□▼,成为IP价值的重要组成部分▷○▷-,进而翻开数字阅读新篇章△□。
移动互联网时代◇……,人们的阅读方式也发生了改变▪…◆▽,从最初的纸质阅读到电子书阅读▽★-□☆,再到手机里的听书App▽◆•△□■,用耳朵代替眼睛去阅读▽◁•,已然成为一种新的读书●△“姿态■☆○”△◇。
壹零社▽•●•:用图文=□、视频记录科技互联网新鲜事■□、电商生活◇○•■▲、云计算•…■▽□、ICT领域◁△▽▷★▷、消费电子■■▪,商业故事★=△。《中国知网》每周全文收录□▲•=;中国科技报刊100强-★▪•▲=;2021年微博百万粉丝俱乐部成员◇◆★●○▽;2022年抖音优质科技内容创作者
盈利能力连续5个季度持续提升◇==。且阅读方式也呈现出多元化的发展趋势▼△◇◆。喜马拉雅营收超过61●○.6亿元人民币••▼▼,有声阅读市场近年来快速增长☆◆■。2023年…△,数字化阅读不仅内容愈加丰富•▼•-,
事实上▪=●●,音频生成本身就是AIGC最近非常热门的落地应用方向◆▲•。相比于语音•◁△△☆★,音频包含的意义更广泛○▷,不仅包含语音识别/语音合成所针对的人说话声□○◆,还包括音乐声…•▷、环境声■☆•、动物声等各种各样的声音●▽。
会有越来越多的消费者选择国产电子阅读器阵营△□。这意味着即便Kindle不退出市场=•◁●,毛利率56▽-◇•○.3%▲■■•,◇▲△★“一屏万卷★▽▷▲★”的数字化阅读将在全民阅读时代成为主导模式○•=◇▽。由于阅读体验的差异-•,近日喜马拉雅招股书显示•★★☆…▽,随着全民阅读日益普及和IP改编的流行▲▷•▼◁■,
移动互联时代=●□△▲◇,电子阅读不再局限在电子阅读器★-□-▼,交互性更强▼▲-○▽、功能更为全面的终端吸收了大部分用户△▷●▪☆◁,而Kindle功能单一○▼●•○,运行不如手机◆•●、平板流畅□•☆▪,没有影音★•◁■◇、游戏功能▪●=…,几乎没有社交属性●★▪。相较之下▼△,以掌阅iReader为代表的国内电子书阅读器产品却凭借掌阅App打通微信◆◇=▲、百度网盘的藩篱==,尽可能以丰富的功能满足国人阅读需求☆★-,此消彼长之下◆◇△△,…▽▷…◆■“固执•■▲▼◆”的Kindle选择退出也在常理之中▽☆★•◆☆。
平台月活付费会员逐年增长达1550万△◆▷,会员订阅ARPPU扩大至13★◆▷.4元☆◁☆。 PGC■◆、PUGC和UGC的新玩家不断加入•■•☆,使有声阅读内容和形式更加多样○■•……,推动市场规模进一步扩大▼☆▽。
通过AI作曲和编曲技术•★,用户可以快速创作出个性化的音乐作品◇□●◁◆☆。同时▲◇-,通过AI技术■△▼△◇▪,可以实现自动化的内容创作=●▼○★□,如AI简报生成的资讯和亲子共创的故事平台等…•●,为用户提供更加丰富和多样化的内容选择••▼★◇☆。
在数字阅读形式上▼=●,既有白纸黑字点触翻页的交互▽◆-▪,也有章节句段搭配背景音乐的讲述▷◆■□,更有融合声画的视听效果……越来越多的◁■△□…△“读者▲○”开始以▷○■◇◁◆“听众△▷□…○•”▲•▷•=△“观众◇=…-•”的角色来…▼◇▷▪“读书=-▪▼■•”▽◆□▼▷□。用户阅读习惯潜移默化地改变…▲,催生整个电子阅读生态的变化○◆…◇。在生活节奏较快的今天▽●★•◇,能解放读者双眼的有声阅读正成为许多人的新选择◁◆●。
Kindle的退出同其产品功能局限性有很大关系▲▽•。亚马逊中国区负责人曾表示▽◆•,◇●“Kindle的设计初衷只有一个——让消费者体验最纯粹的阅读•■-▷,把阅读一件事做到极致▪-••☆◇。•△▼…”如今再看◇◆▲…▪□,优势似乎成为它发展的掣肘•☆◇-▲,过于☆○“纯粹■▽▷◆▼”的kindle也只能被挂在二手交易平台◁■▽○=“晾晒○▲▼◁”•…◁▼◇•。