《星火2003》

第一百七十五章 天才的面前没有挫折(2/4)

  而另一边,王建成已经设置好了模型的基本参数,也连接上了模拟飞行程序。

  在之后的训练里,模型将会根据飞行程序输入的随机指令自动开始学习,用高频率的试错逐渐去寻找收益最大的策略。

  “所以你们的判据是最后怎么设置的?还是之前说的那样,以跟随距离为标准吗?”

  楚建树开口问道。

  “不是,已经改了。这个判据太死板了,如果只使用距离作为判据,虽然成功率高,但同时,一旦失败,造成的后果也很严重。”

  “我们没办法把预估损失也作为判据加进去,那样的话,整个模型会变得太过庞大。”

  “即使我们现在的小型机跑得动,以后真上了无人机也跑不动。”

  “所以,最后的策略是,使用归队成功率作为主权重判据,距离只作为辅助。”

  听到陈念的回答,楚建树眼前一亮。

  这的确是一个很聪明的策略。

  作为编队中的重要部分,毫无疑问,无人机是要跟有人机组成飞行编队的,但由于性能上的差异,编队的队形不可能永远保持稳定。

  ——

  别说有人、无人混编了,哪怕纯粹的有人机编队,也不可能在战斗中始终保持队形。

  但另一方面,如果想要形成战斗力,编队、分组又是必须的。

  这就要求飞行员在完成战术动作之后迅速归位。

  以此为标准,去约束无人机的行动,并作为机器学习训练的判据,一方面给了模型更大的自由度,一方面也能满足实际使用的需求,可以说是折中情况下最好的选择了。

  这两小子不愧是天才啊,一法通万法通,为了这个模型,他们所掌握的绝对不仅仅是单一的人工智能知识而已。

  面向对象的开发,才是真正有用的开发啊。

  不过,一个普通的学生,怎么会有这样的见识呢?

  ——

  他还不知道,此时的陈念,对于空军战术的了解,其实都是已经有过实践经验的了

  “很聪明,这应该是我们最好的解决方案了。咱们现在就开始吗?”

  “现在开始!”

  王建成点了点头,手指轻敲回车键。

  伴随着小型机的风扇转动,程序立刻开始了运转。

  一条条数据不断输入到模型中,由于没有可视化界面,所有的学习过程都是以数据的形式呈现。

  楚建树看的都不太明白,倒是王建成,一边紧紧盯着疯狂闪烁的一行行代码,一边不断地开口解释:

  “已经完成一千次训练了,效果很差,成功率0%不过也正常,我估计至少要训练百万次以上,才能达到初步的效果。”

  “五千次,这算成功了一次,有一架无人机归队了,但这是运气,策略还没办法形成”

  时间一分一秒地过去,随着程序的不断运转,王建成的脸色变得越来越凝重。

  原因无他,成功率太低了!

  这个模型的训练效果远远要弱于他的预期,如果按照这样的效率,恐怕亿级的训练都不够用。

  那还玩个屁啊?

  机器学习中有一条铁律:

  当AI的训练强度大于人工训练强度时,那模型就是无效的。

  很显然,他手里的这个模型,就是这样的情况。

  “不太行啊.这个算法好像达不到可用的标准。”

  “训练效率太过低下了,策略生成的速度也慢。”

  “这么搞下去,我们还不如人工遍历定制策略来的划算了.”

  听到他的话,陈念也皱起了眉头。

  他开口问道:

  “能看出原因吗?”

  “看不出来.我感觉咱们的算法应该是没什么大问题的,但是,冷启动耗费的资源太多了。”

  “机器学习的本质也是遍历,但它没办法做任何感性经验的参考。”

  “也就是说,人工先验和机器先验拉不齐”

  看着王建成略微有些失望的眼神,陈念继续问道:

  “上次聊的混淆矩阵呢?能解决吗?”

  “解决不了.现在我们的问题是,priors和experience都比较少,想要高效得到高水平解决方案,就必须要求机器的智能化水平极高。”

  “而且目前来看,这个任务的generalization,也就是任务泛化难度本身就很大,进一步提高了对机器的要求。”

  “不行,这么跑下去不是个事儿。”

  说着,王建成直接敲-->>

本章未完,点击下一页继续阅读