当前位置:五三书院>武侠修真>开局熊孩子偷外卖,反手索赔千万> 第五百七十一章寻找训练数据
阅读设置(推荐配合 快捷键[F11] 进入全屏沉浸式阅读)

设置X

第五百七十一章寻找训练数据(1 / 2)

紧接着,孙宇、虞倩、周子怡,宋志杰等人,便离开了龙芯国际了,不过,想要完整的构建出来一个基于自然语言的人工智能模型,单单是拥有芯片,是远远不够的。

还必须拥有海量的数据才行,只有芯片、大数据、基于自然语言的计算机模型,三者合二为一,才能够诞生出一个真正跨时代的人工智能!

走到了大街上,虞倩长吁短叹道:“孙宇老板,咱们接下来是要做什么?是去寻找大数据了吗?可是,想要找到大数据的话,可不是一件简单的事情啊!”

“咱们国内的大数据,基本都存在于一个个信息孤岛之中,是被封存在那些软件里面,如果那些软件的开发商不同意的话,咱们根本就无法利用网路爬虫找到那些数据了。”

“这一点,咱们跟国外相比,就有很大的差距了,因为,国外的那些数据,基本上都是有着网页版的,根本就不用担心找不到数据的问题,可是,这一点,在咱们天域,可是一个瓶颈了,如果处理不好的话,哪怕咱们购买了充足的芯片,也是无法研发成功的。”

宋志杰律师,在听到了虞倩主播的话

语后,也点了点头,说道:“虞倩主播也没说错,这确实是一个亟待解决的问题,咱们想要让那些互联网公司交出自家的数据,简直是太难太难了,但是,在国外就不一样了。”

“这些大数据,在那些互联网公司的内部,是被称作是商业机密的,可以说,如果那些大公司能够把自己的数据给你了,那才叫奇怪呢!你掌握了人家的这种数据,跟掌握了人家的公司,也没什么区别了。”

“我如果是那些互联网大厂的老板,肯定是坚决不会同意的,开玩笑,你想要大数据,门儿都没有,这可是人家的商业机密,尤其是说给就能给的?就算你是为了帮助咱们天域解决一系列卡脖子的难题,但是想要动人家的商业机密,这也是绝对无法做到的。”

周子怡警官在听取了宋志杰律师和虞倩主播的建议后,结合自己对于宏观局势的理解,说道:“孙宇,如果你在找咱们国内的数据训练,这比较困难的话,不如就去国际社会上,利用网路爬虫抓取那些国外公司的数据?”

“我觉得,那些网络小说,尤其是一些知名作家所写的,会不会对你

研发人工智能也有一定的帮助呢?尤其是那些写实文学,这种写实文学,上面有着大量的对话,这些作家们所编写的对话内容,对于训练你的智能模型,我认为应该会起到不小的帮助。”

“咱们国内的很多小说,都是具有盗版的,你可以利用这些大数据,再加上国外的大数据,两者合起来,说不定能够训练出一个相对有效的人工智能!”

虞倩和宋志杰的建议,都不是多么的靠谱,现在看来,更加靠谱的,也就只有周子怡警官了。

于是,孙宇看了一眼周子怡警官,缓缓开口道:“嗯,没错,你的这个建议倒是一个很好的建议,既然咱们不能利用国内的信息孤岛里的数据,就先利用国际上的数据,先把正纳闷的这个人工智能模型,给训练得有模有样的。”

“只要咱们的这个人工智能模型,被训练的有模有样的,然后咱们再跟天域的高层沟通一下,让高层人员跟那些互联网大厂的老总们沟通沟通,让我们能够获取到国内软件里的数据,最终,把国内和国外的数据,都学习的差不多了,咱们的这个人工智能模型,也就构建的差

不多了吧。”

“我坚信,人工智能绝对是引领这个时代第四次科技革命最重要的技术,以前人们总说,人工智能可以运用在各种领域里,但是过了那么多年了,整体的人工智能行业都没有什么进展,许多人也就不再关注这个人工智能行业了。”

“要不了多久,当所投资的这个基于人类自然语言模型的人工智能,被成功的开发出来的时候,绝对会惊艳四方的,这也是我坚决投资的最主要的原因。”

孙宇的格局,不得不令人佩服,若是换了其他的人,绝对不会有这样的气魄。

开玩笑,把这么多的钱,都投资到一个很大概率亏本的行业,尤其是,孙宇投资的那个鲍勃,鲍勃的原始股权结构规定了,这是一个非盈利的企业,夕阳产业再加上人工智能,就更加不会有那么多人愿意去投资了。

几人一边聊着天,一边回到了鲍勃的别墅。

孙宇等人打开别墅的大门,看见鲍勃正在跟他的同事们,正在疯狂的写代码。

“你们的人工智能模型,编写的怎么样了?”孙宇询问研发的进度道。

“由于我们是基于人类的自然语言进行研发

的,因此,在这个过程之中,难度比起其他的人工智能公司,是截然不同的,难度大得多,但是,我们也有信心。”鲍勃说道。

“我们这里,有着好几个获得了诺奖的数学家,再研发这个自然语言的智能模型时,缺少不了这些最为知名的数学家,因为,咱们人类在思考问题的时候,其实是

上一章 目录 +书签 下一页