智能语音拼写软件肯定需要一个大的词汇库。
那样的词汇库,并不是单单指文字的词汇库,更重要的每一个字在各地的普通话中可能出现的地方口音。
比如普通话大部分中国人会说,但是真正说得标准的人并不占优。特别没有几个人能真正将所有汉字都会读,更不会要说是说得标准。另外有很多字是多音字,语音拼写又必须兼顾效率和准确。
所以一个庞大的词汇库是肯定很需要的。而这个数据库因为涉及到音轨数据,数据量也比文字要大得多。
那最好是利用一个云计算技术进行解决。将全国所有人针对各个词组的口音和错误方式都收集起来。甚至是可以用方言进行创作。
所以这个智能语音拼写软件,唐浩泽真心不是很很急。其实也急不来。
不过该做的,也应当提前做起来。
他提议说:“我们可以邀请用户录制我们指定的文章音轨文件。参与的人,可以在网站上给予一定的奖励。”
向子荣听他这话,也明白他话里所指。他皱眉说:“如果通过那样收集数据模板。我们的工作量会很大。”
“反正我们也不急于求成。收集到足够的数据后,在综合分析并且建立模板。”
向子荣想了想,说:“好,我回去让人选择几篇合适的文章先试一下。”
“阅读的文章,可以选择一些名篇。不需要他们用朗读的方式。而是用说话的方式。流畅就好。”唐洪泽想一下,建议说。“比如说用鲁迅先生的文章。还有一些古文,比如《爱莲说》、《长歌行》等等中学课本上的文言文或者长诗。”
向子荣一听,笑着说:“这个主意不错。”
中学语文课本收录的鲁迅先生的文章和文言文,有不少是要背诵的。文言文就不用说了,那与现在的语言习惯有很大的不同,朗读和背诵并不容易。而鲁迅先生的文章读起来都会觉得有些拗口,背诵起来肯定不好受。
所以在中学时代有一句名言:一怕周树人,二怕文言文。
有那样的文字的阅读数据,应当可以建立不少的模板。
两人又就这个问题谈了一会,向子荣才离开了。
没几天,圈子网集团又制造出一个大新闻。
以上是《计算机世界》刊登的一篇文章的标题。
该文的作者在文章中指出:“圈子网的将批评是做污蔑或者诽谤的。将无意的过错当做罪过。编者注意到在圈子网集团已经向法院起诉中的被告名单中,发现了几个著名的博【2】客主。他们都是比较著名的公共知识分子。公共知识分子存在的意义就是向公众传播知识,对公共事务进行分析……”
然后又说:“编者还注意到,当圈子网某个子网站涉嫌传播淫【2】秽视频事件发生后,对圈子网做出了批评,但是在圈子网澄清之后,不少因此被告的人在不久之后就删除了自己的言论。这不能说那些被告没有过错,但是知错能改,善莫大焉。圈子网悍然将他们也诉诸法庭,未免太过不近人情……”
最后的结论还听辛辣:“……我们注意到,仅仅三天时间,圈子网集团在全国范围内就该时间针对个人提起的诽谤诉讼案高达六百多起。具圈子网集团的公告,似乎还会有更多。这种做法看似保护了圈子网集团的权益。但是以言入罪,与古代的文字狱有何差别?圈子网集团这种疯狂的行径,无疑会极大损害网络发展。”
唐浩泽看过这篇文章后,嗤笑一声。
文字狱?这是将圈子网集团当做野猪皮人了?
他不屑于回应。不过圈子网集团的公关部不是吃素的,当即发表了一份声明。
“我们注意到某计算机权威报刊报刊登的某位著名水军头目的文章。改文章声称圈子网集团的维权行动是疯子行为,将会危害中国网络的自由发展。对此我们不仅不敢苟同,更觉得极其荒诞。圈子网集团在第一时间要求所有人停止对我司的诽谤和污蔑。但是在事情得到澄清后,依然有不少人拿了钱而继续在网络上,继续有针对性、有目的性地散播谣言,继续污蔑诽谤圈子网。而现所有被起诉的人,我们都有证据显示他们是拿钱办事的。
“至于说批评,如果是符合客观事实的,我们会虚心接受批评,更会认真改正。但是某些所谓公知分子的批评,我们是敬谢不敏的。公知分子的可敬之处勿用赘言,但绝对不包括拿钱说话。至于证据,我们有。但只会交给法庭。
“我司可以毫不讳言,这篇文章的作者也在我们的起诉名单之内。至于说我们的维权行为不仅不会给网络带来阻碍,反而会对肃清网络起到积极作用。网络不应当成为被人用来传播谣言以获取利益的平台。网络也不应当因为其虚拟性就可以成为某些人没有原则、没有根绝、没有底线的语言暴力平台。
“我司誓将用法律武器维护合法权益,不会因为任何外来干扰而又改变。”
圈子网集团在舆论上针锋相对,在当日更再次公布了一批起诉被告名单,名单内果然有那位《是圈子网还是疯子网?》的作者。名单内总被告人数高达一千六百人多人。
圈子网集团的我行我素引起舆论的一片哗然。指责圈子网集团是得理不饶人、不近人情。
唐浩泽对此并不在意。圈子网集团是受害者,别人说什么。他都只想给那些人一句话:干卿底事!
外面的纷扰丝毫没有干扰到他的生活和工作。这天卢梦因为工作离开公司,下班也就直接回家了。他下班从公司出来。车子才开出地下停车场出口。
张文说:“老板,前面是南警官。”
唐浩泽从车窗看了一眼,看到南轩松在前面的伸手示意车子停下。他就让张文先停下。
南轩松小跑过来。唐浩泽按下车窗笑着说:“南警官,这不是要我去协助调查吧?”
“当然不是,就是有点事想和唐先生谈一谈。”
唐浩泽说:“上车!”
南轩松从车后转过另外一边上了车。唐洪泽让张文继续开车,这才对南轩松说:“南警官想和谈什么?”
“唐先生,圈子网集团这几天的行动让我们的工作相当被动。当然,我不是说你们的维权行动有错,但起诉的人太多。影响太大了!”
唐浩泽一脸不解,问:“南警官的意思是我们被人欺负了就要忍声吞气?”
“当然不是要忍声吞气。但我知道圈子网起诉那些人并不是为了要求赔偿。只是想要的给那些人发出一个警告,这个目的现在也已经达到了。但这个警告波及的人太多。那不仅增加了圈子网集团的工作量。更增加了圈子网的经营成本。”
唐浩泽笑着摇头说:“南警官太看得起圈子网了。我们集团只是小本经营,大鸡也吃小米。多一分钱收入就是多一分。这次起诉我们可以打算从那些人身上狠狠刮一层。”
南轩松自然不会相信他的鬼话,但也不会傻得去反驳:“网络的乱象,我们网监中心也一直在监控并且压力打击。不过我想不管是我们职能部门,还是包括圈子网集团在内的互联网企业,都希望互联网能有序、高速发展。圈子网集团的这次行为,自然是正当的维权行动。但也有可能会造成比较恶劣的影响。”
他顿了一下,说:“极有可能会让有关部门出台更严格的法规约束网民行为。那虽然是有必要的。但现在正是互联网的高速发展期,太过严格的法规,会迟缓互联网行业的发展。大环境发生变化,圈子网也会受到影响。”
唐浩泽听完这话,肃容说:“南警官。你不要吓我。我是复旦出来的,可不是厦大毕业的,不经吓!圈子网一个小小的维权行动就能让上面出台那样的法规?”
“圈子网这几天在沪市几个地方法庭陆续提起了两百多起诉讼案。这已经极大引起我市领导的关心。甚至已经引起了中央网监部门的关切。”
在和南轩松的交谈中,唐浩泽想了许多。他相信南轩松特地找他,说的那些话不是无的放矢。圈子网集团高调起诉那些人无可指摘。但也将互联网的一些阴暗面暴露出来。
任何一个世界都有光和暗的纠结。但圈子网集团的做法确实让有些部门坐蜡。
既然是这样,他就给他们一个面子也未尝不可。
但该告的人肯定是要告的,但绝对不能向之前那么高调了。
唐浩泽想了一会说:“圈子网集团说过的话,不能自打嘴巴!”
南轩松心里松了一口气。他也不敢得寸进尺,说:“只要低调一些就好。另外最好和那些侵害圈子网集团权益的人或者单位先协商解决。在舆论上,也请圈子网保持克制。”
唐浩泽点头说:“感谢南警官的提醒!”说完又问南轩松要去哪里。
南轩松说在路上放下他就好,但唐浩泽还是将他送到目的地。