从信息学霸到神级科学家
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

第43章 玄学大师林欣然

下午,众人跟着工作人员来到了位于研究所中心的控制实验室。

实验室内空间很大,周围有着各组工具存放柜,还有焊接操作台和安装电子元器件所需的防静电工作台。

实验室侧面,是模拟区,放着几台服务器和显示屏。

然而最显眼的实验室中央位置,竟然有一整台汽车,江铭都不理解这是怎么开进来的。

“这就是华汽即将发售的蓝宝石-II型的SUV,我们公司准备在该型号的升级版中搭载自适应巡航系统。”,工作人员为众人介绍道。

“汽车的各类参数在设计之初就已经输入了服务器上的模拟环境中。”,工作人员又一指侧面的电脑与服务器。

“各位学员可以用实验室里的电脑,也可以用自己的电脑链接服务器,在上面开发自己所设计的控制算法。”

众学员很快落座,都开始了自己组控制算法的开发。

要论编程难度,江铭所提出的方案几乎比其他组的高出一个量级。

就像华清组所设计的方案,PID控制其实只需要一行公式就完成了,粒子群优化虽然麻烦一点,但也费不了多大事。

而京城理工和滨城工业的方法就更容易写了,他们都不是参数化的方案,自然不需要写优化算法。

只需把建模的内容用代码复述一下即可。

当然,他们也需要多进行一些测试,以完善建模的边界条件。

不过江铭有着【编程达人】的技能辅助,劈里啪啦地键盘敲得飞快,几乎和其他组在同一时间就完成了算法开发。

当然,他也不都是从头开始写的,神经网络的训练部分他们实验室已经积累了成熟的代码块。

因此只需要完成智能体与环境交互的部分,以及计算策略梯度的部分就好。

江铭一点鼠标,启动模拟环境,开始训练!

...

“这个模拟环境还真好用,不但能模拟各种车况和环境,竟然还做了音效。”,耿玮峰感慨道。

他们组的测试工作主要是崔淑蕊在做,因此他也乐得清闲地“到处闲逛”。

仅仅溜达了半分钟,他就径直闲逛向了金陵大学组的位置。

没办法,他实在是好奇江铭提出的方案,必须亲眼看看到底是个什么效果。

刚刚走近,就听到那边传来一阵“轰隆隆”的声响。

“啥情况?你们咋放鞭炮呢?”,耿玮峰不明所以,定睛看去。

只见江铭身后,林欣然和魏雅琪两位美女抱着肩膀一脸嫌弃地看着江铭的屏幕。

屏幕上,一辆车刚刚撞上道路侧面的围栏,四个轮子跑没了两个。

江铭的学习程序还在运行,模拟环境重启,刚刚撞毁的那辆小车又重新上路了。

只见搭载了控制智能体的汽车忽忽悠悠地在路上行驶,一会儿左,一会儿右的。

好几次,耿玮峰都替这辆车捏一把汗。

很快,在小车前方又出现了一辆车,是模拟环境设置的“前车”。

然后,江铭的小车就全力加速,轰的一声撞了上去。

现场一片安静,林欣然脸都黑了。

“这...就这?”,耿玮峰错愕道。

江铭屏幕上的状况早已通过直播共享给了演播室和全部观众。

毕竟上午的时候就连两位评委都对江铭的方案惊为天人,任谁都会好奇这个算法到底效果如何。

此时的弹幕早已笑做一团。

“一通推导猛如虎,司机已经0-5。”

“令人心动的科研这个节目真的非常有意义,在这个综艺里我学会了开车的100种死法。”

“好的,我从现在开始不再担心人类会被机器统治了。”

...

轰!轰!轰!

训练还在继续,江铭的智能体不断探索各种策略,然而结局都是一样的。

当然,也有车子一上来就直接减速,然后一直停留在原地直到模拟最大时长的情况。

幸好江铭设置了单次模拟最长就是1分钟,避免了训练卡在这种极度保守的离谱策略上。

短短的半个小时,林欣然已经见过了不知道多少种作死策略了。

只能说智能体真的很厉害,总能找到一种和之前完全不同的作死策略。

“啊啊啊啊,师弟,到底是怎么回事啊,我们的智能体宝宝是个智障怎么办!”,林欣然开启了摇晃模式,一个劲摇晃着江铭肩膀。

“别急,它还在试错,让它再学一会儿。”,江铭被晃得东倒西歪,但仍然坚定道:“一定会学会的。”

出现这种情况,他的心里也没底。

虽然对于人来说,开车不撞墙其实不太难,最起码保持个匀速总是能做到的吧。

但是对于还在学习的智能体来说,可就没那么简单了。

初始化时,数以千计的神经网络节点中,参数值全部是随机的。

这意味着,在不断试错中,但凡有一个节点的参数没训练好,都有可能让智能体出现奇葩行为。

从概率上来讲,一个好的策略,甚至是一个普通的正常一点的控制策略,在训练前期都是不可能出现的。

江铭默默将模拟环境的时间流速调快到外界的10倍。

此时盯着看小车的模拟其实意义不大,加速模拟反而能让智能体训练的更快一些。

于是,轰隆隆的撞车声出现的频率更快了。

江铭黑着脸,调出了监控接口。

这是他之前在实现算法的时候就写好的,用于实时观测目标函数的变动。

不出所料,目标函数还仍然在负数域震荡,只能看出一丁点的爬升迹象。

他隐隐感觉,智能体还是没找到正确的方向,仍然在不断试错。

一旦找到一次,便会呈现出一段目标函数的激增,之后的更新便是一片坦途。

这种时候,可能真的是需要一些运气了。

“我可以帮上什么忙吗?”,林欣然在一旁弱弱地问。

“师姐,你可以帮我来一段祈祷吗?我知道,搞玄学你一直是在行的!”,江铭一边看向林欣然身上的各种玄学配件,一本正经地道。

“好吧。”,林欣然解下脖子上的十字架吊坠,握在手中,这是她来参加综艺特意准备的。

“哦,伟大的算法之神。在这片数据的海洋中,我们寻求智慧的光芒。我们的智能体迷失在状态空间的迷宫,我们的策略在高维的荒野中徘徊。”

“请指引我们,在策略迭代的征途上,不断前行,直至找到最优的解。”

“阿门。”

林欣然睁开眼睛,定睛看向显示器。

只见新一轮的迭代中,目标函数值突然一个飞跃,突破了零点,且仍在稳步提升着...

...