八一中文网
会员书架
首页 >都市言情 >重生不重来 > 第四六零章 圈子网=疯子网?

第四六零章 圈子网=疯子网?(第1 / 3页)

上一章 章节目录 加入书签 下一页
推荐小说:

向子荣想了想,说:“好,我回去让人选择几篇合适的文章先试一下。”

“阅读的文章,可以选择一些名篇。不需要他们用朗读的方式。而是用说话的方式。流畅就好。”唐洪泽想一下,建议说。“比如说用鲁迅先生的文章。还有一些古文,比如《爱莲说》、《长歌行》等等中学课本上的文言文或者长诗。”

向子荣一听,笑着说:“这个主意不错。”

中学语文课本收录的鲁迅先生的文章和文言文,有不少是要背诵的。文言文就不用说了,那与现在的语言习惯有很大的不同,朗读和背诵并不容易。而鲁迅先生的文章读起来都会觉得有些拗口,背诵起来肯定不好受。

所以在中学时代有一句名言:一怕周树人,二怕文言文。

智能语音拼写软件肯定需要一个大的词汇库。

那样的词汇库,并不是单单指文字的词汇库,更重要的每一个字在各地的普通话中可能出现的地方口音。

比如普通话大部分中国人会说,但是真正说得标准的人并不占优。特别没有几个人能真正将所有汉字都会读,更不会要说是说得标准。另外有很多字是多音字,语音拼写又必须兼顾效率和准确。

所以一个庞大的词汇库是肯定很需要的。而这个数据库因为涉及到音轨数据,数据量也比文字要大得多。

那最好是利用一个云计算技术进行解决。将全国所有人针对各个词组的口音和错误方式都收集起来。甚至是可以用方言进行创作。

有那样的文字的阅读数据,应当可以建立不少的模板。

两人又就这个问题谈了一会,向子荣才离开了。

没几天,圈子网集团又制造出一个大新闻。

《是圈子网还是是疯子网?》

所以这个智能语音拼写软件,唐浩泽真心不是很很急。其实也急不来。

不过该做的,也应当提前做起来。

他提议说:“我们可以邀请用户录制我们指定的文章音轨文件。参与的人,可以在网站上给予一定的奖励。”

向子荣听他这话,也明白他话里所指。他皱眉说:“如果通过那样收集数据模板。我们的工作量会很大。”

“反正我们也不急于求成。收集到足够的数据后,在综合分析并且建立模板。”

点击切换 [繁体版]    [简体版]
上一章 章节目录 加入书签 下一页