Jahmobbin
2021-12-10T17:36:54+00:00
这两天一直在学习强化学习进行聚类分析方面的东西,其中有一个方法是训练一个神经网络来指导蒙特卡洛树搜索来进行分层聚类的算法,主要是训练一个神经网络,输入是当前样本点,输出是其中任意两个样本点进行聚类的概率。但问题来了,随着聚类过程的进行,样本点的个数一直在减少啊,每进行一步输入的样本点会比上一次少一个,同理输出也会少。输入输出空间在变的情况下该怎么训练这个神经网络呢?
[img]https://img.nga.178.com/attachments/mon_202112/14/-7Q2p-2p9zK4T1kSau-1q.jpg[/img][img]https://img.nga.178.com/attachments/mon_202112/14/-7Q2p-2lv7KgT1kSb3-au.jpg[/img]
这是示意图和公式,其中公式里的π就是神经网络的输出。
求求大佬救救孩子吧,研究僧真的快秃了。有大佬能帮助到的支付宝50红包送上!
[img]https://img.nga.178.com/attachments/mon_202112/14/-7Q2p-2p9zK4T1kSau-1q.jpg[/img][img]https://img.nga.178.com/attachments/mon_202112/14/-7Q2p-2lv7KgT1kSb3-au.jpg[/img]
这是示意图和公式,其中公式里的π就是神经网络的输出。
求求大佬救救孩子吧,研究僧真的快秃了。有大佬能帮助到的支付宝50红包送上!