第35章 神经网络
智障四人组的表情包很快在计算机学院流传开来。
其中一张流传最广的表情包,是四人对着小白板上的一个“S”字母冥思苦想。然后不知哪位好事者正好路过给拍了下来,然后在小白板上“S”字母旁边,P上了一个“B”。
信息年代,传播飞快。
这个表情包很快就传遍了整个金陵大学。
好事者们给它取了个名字--名画:智慧的凝视。
然后,在金陵高校圈子里也传开了。最后,上了金陵晚报的头条,成为了金陵城一连几日街头巷尾的谈资。
这主要是金陵大学的四位天之骄子,对着“S”和“B”两个字母如此深思,给人视觉反差太大。
以至于金陵日报的记者都向校方约稿想采访,结果自然是被主管行政的副校长给婉拒了。
但是风波已经起来了。为此,王教授在计算机学院发飙了。
“哪个龟儿子拍的这张照片,以后还想不想毕业了。”
可即便如此,也架不住学生们恶搞的热情。
于是,那张表情包的小白板上的内容被换成了各种事物。
比如:“元芳,你怎么看。”
再比如:国足对着空门一脚打了飞机。
。
。
但其实,那一天四人是在深思算法。
由于数字只有10个,但如今即便只是识别英文和标点,就已经是好几十个不同符号。这其中的复杂度一下子上升了很多。
如果无脑套用原来的SVM多分类方法,先不说准确率,光是计算量就会成倍增加。就实验楼的这些破电脑,跑这种级别的运算,绝对是不可能的。
所以,齐凡等人很头疼。他们需要在保证准确率的同时,又得精简算法,以便降低运算量。
在经过多次的失败尝试之后,齐凡大胆提出设想--不再将符号识别当成分类任务,而是应该当成回归任务。
所谓的回归,其与分类的本质在于:分类是预测结果集合中的一个值,而回归则是输出一个预测数值。
回归适合的是类似波士顿房价预测那种,预测一个变化的值,而不是数字识别这种,预测一个数字。因为数值是变化的,但是数字再怎么变,也跳不出0~9的范畴。
于是齐凡转换思路。他提出不再输出一个预测的符号,而是输出每个符号对应的概率。这样一来,就把分类任务变成了回归任务。
就好比,原先模型预测的结果是:0~9这几个数字。现在模型预测的结果是0~9各自对应的概率。最终的结果可取概率最大的那个数字。
在几人连着熬了几晚后,模型确实可行,无论是复杂度还是计算量都大大降低了。可错误率却是一言难尽,达到了可怕的80%。
80%!真的是牵一条华国田园犬过来训练下,都不至于会有如此之高的错误率。
这个结果不知道是不是因为张开的大嘴巴,很快不胫而走。于是新的表情包诞生了。
四个人旁边被PS了一条华国田园犬,小白板上PS了“80%”的图标。底下是一行小字--四名金大学子与狗的终极PK。
齐凡也曾幻想过自己有一天学术有成,金陵日报来采访自己。可不曾想自己会以这种方式出名。
齐凡四人在食堂吃饭的时候,不乏有人路过对他们指指点点。对此四人倒也懒得去理会。因为他们如今脑子里都是比赛。
那80%的错误率就如一座大山,他们就像手拿锄头的愚公。望山兴叹,一筹莫展。
几天后又是齐凡站了出来。
他想到了先对各种符号做分类预处理。将数字、标点、英文分为三大类,第一步先对这三大类做分类任务。相当于先让模型去区分一个符号,到底是属于数字还是标点,亦或者是英文。
随后再针对三大类各自训练一个专用模型。
数字的模型仅用来识别数字,标点的模型仅用来是被标点,英文的模型仅用来识别英文。
照着这个思路经过几天熬夜后。数字和标点的错误率降到了15%,因为数字和标点种类最少最好识别。可英文就尴尬了,因为有26个字母。英文的错误率依然高达60%。
齐凡连日来困恼于此,以至于陪李月散步时都在想这件事情。
夜晚的金大校园,昏暗路灯下,两道狭长的身影交织漫步着。
“哼!无趣。”
“啊?怎么了?”齐凡听到李月重重哼了一声后回过神来。
“我刚刚说了什么。”
“你就‘哼’了下。”
“我哼之前呢?”
“额,你有说吗?”
李月嗔怒道,“你一天到晚泡在实验室里,难得陪我一会儿,都这么心不在焉。”
“哎,比赛还有半个月就要提交。要是就现在这么个结果,我真就成重在参与了。”
“实在不行就算了嘛,你毕竟才大一,来日方长。”
齐凡没有答话,作为身怀系统的人,他此刻万分的沮丧。这破系统竟然没有在关键时候给点提示,一点都没有金手指的样子。
“难道这世界上就没有关于符号识别的现成技术方案?”李月好奇道。
“有肯定是有,可是各大视觉公司都像宝贝一样攥在手里。也有一些论文涉及这块,可是所用的方法都过于繁杂,对于人力和硬件要求都较高。”
“那王教授就没给点提示吗?”
“他老人家说,是我们比赛不是他比赛,他不方便出手。但是,以我的观察。他能给的建议也逃不出论文上提及的范畴。顶多就是在细节方面能给一些帮助,可是这并不能改变什么。”
“如果最后大家都采用国际上,机器视觉领域最前沿那几篇论文的观点。最后无非是一起抄作业,就看谁抄的最像。”
李月惊讶道,“听你的口气,你连前沿论文的观点都看不上。”
齐凡很自然道,“对啊。他们用的方法还是基于图像形态学,人为参与太多,几乎是手把着手在教机器学习。过于笨重,不够智能。”
“我的天。我男朋友果然是个怪物,这才大一就敢吐槽国际顶刊的论文。”
齐凡仍旧不以为然,“因为他们的办法真的太笨了,我总有种直觉,他们的方向本就错了。如果AI需要人手把着手教才能工作,那还叫什么‘人工智能’,干脆叫‘人工智障’得了。”
李月掩嘴一笑,“你们四个不正好是人工智障四人组嘛。”
齐凡在她脸上轻轻拧了一把,“连你也取笑我们。”
李月随即安慰他,“好了,你先别想了,陪我好好走走,然后回去好好睡一觉,说不定第二天就有办法了呢。”
“元素周期表和苯的分子结构式,倒还真是发明者做梦时候想到的。可是这在历史上总共也就两回,可能是门捷列夫和凯库勒老爷子,脑神经碰巧哪根搭错了。”
李月还想接着安慰他,可齐凡却突然爆发出一声惊呼,“对啊。脑神经,我怎么忘了这茬。”
齐凡捧起李月的脸狠狠亲了一口,“我果然也是天选之子。”
要不是李月提起睡觉,齐凡就不会想到门捷列夫等人,也就不会顺嘴提到那帮老爷子神经搭错。也就不会想起之前自己看过的《神经网络在机器学习中的运用》。
“我可以利用神经网络的自学习特性试一试。”
齐凡说完转身就狂奔而走。
尼玛,李月在心中爆了句粗口。
“你给老娘站住。”李月大声吼道。
“啊?怎么了?”齐凡一脸困惑刹住脚步回望。
“你是不是忘了什么东西。”
齐凡在自己身上摸了下,“没有啊。”
“那你继续走吧。”
齐凡继续往前走了几步,随后忽然想起了什么,赶忙快步跑回李月身边,神色有些尴尬。
“怎么不走了?”
“哈哈。”齐凡尴尬笑笑,“我先送你回去。”
齐凡把李月送到宿舍楼下后,飞也似的往自己宿舍狂奔。
李月看着他的背影一阵无语,幽幽道,“果然天生是个学霸,想到思路了,连自己香香软软的女朋友都不管了。”