多语数据比单一语种数据价值能高出多少倍吗?(组图)

作为中国最具代表性的跨境电商公司,阿里巴巴国际站上的商品数量超过1亿件,每件商品平均有2000字的商品描述。据此计算,阿里巴巴国际站需要翻译的产品总量超过2000亿。字,而且这个数字每天都在增长。中国跨境电商产品总翻译量预计每年将超过4000亿字。

对 BAT 的需求只是冰山一角。据《2015年全球互联网报告》最新公布的数据显示,目前全球网民超过30亿,占全球总人口的40%。截至2014年12月语言传输指数指的是什么,中国网民规模达到6.49亿,互联网普及率为47.9%。然而全球近90%的网民除了母语外没有其他语言技能,其中59.超过4%的用户有跨语言、交友、购物、娱乐、旅游的需求,享受教育等。

信息、视频多媒体、社交媒体、电商网站上每天都在以指数级增长的不可估量的数据,每时每刻都在提醒我们,我们正处于大数据时代。

图片[1]-多语数据比单一语种数据价值能高出多少倍吗?(组图)-老王博客

在国家大数据战略下,各行各业的大数据应用都在挖掘数据海洋的价值。据中国信息通信研究院报告,2015年中国大数据市场规模为116亿元;IDC数据显示,2016年全球大数据市场规模将达到238亿美元;《中国大数据产业白皮书》大胆预测,2020年中国大数据市场规模为8200亿元;而麦肯锡对2020年美国大数据市值的估计为6900亿美元。

然而,目前大多数大数据都只是一种语言,而那些分散在世界各地的多语言价值观,大部分都在沉睡在海底。放眼世界,你有没有想过,组合多语言数据的价值可以比单语言数据高多少倍?这个不可估量的价值如何恢复?

好消息是,语言大数据至少在目前是解决这个问题的方法。语言是一切交流的基础。通过对语料的采集、处理和智能分析,从数据源中捕捉跨语言大数据的价值。

近日,“语言大数据联盟”成立筹备会在北京召开。该联盟是一个基于大数据资源开放共享平台的全球性、多领域、多语言的科研应用联盟。发起,将解决语言大数据下的一系列问题,为全民提供跨语言大数据智库。据悉,2016年4月8日,联盟将在青岛召开第一次大会。届时,将有100多所高校、企业和科研机构参会语言传输指数指的是什么,共同就语言大数据的共建、共享与协作进行深入研究。交流和分享。

© 版权声明
THE END
喜欢就支持一下吧
点赞0
分享
评论 抢沙发

请登录后发表评论