[学术氵]机器学习大佬进,救救孩子吧头快秃了,有红包!

Jahmobbin-avatar

Jahmobbin

2021-12-10T17:36:54+00:00

这两天一直在学习强化学习进行聚类分析方面的东西,其中有一个方法是训练一个神经网络来指导蒙特卡洛树搜索来进行分层聚类的算法,主要是训练一个神经网络,输入是当前样本点,输出是其中任意两个样本点进行聚类的概率。但问题来了,随着聚类过程的进行,样本点的个数一直在减少啊,每进行一步输入的样本点会比上一次少一个,同理输出也会少。输入输出空间在变的情况下该怎么训练这个神经网络呢?

[img]https://img.nga.178.com/attachments/mon_202112/14/-7Q2p-2p9zK4T1kSau-1q.jpg[/img][img]https://img.nga.178.com/attachments/mon_202112/14/-7Q2p-2lv7KgT1kSb3-au.jpg[/img]
这是示意图和公式,其中公式里的π就是神经网络的输出。

求求大佬救救孩子吧,研究僧真的快秃了。有大佬能帮助到的支付宝50红包送上!
sei.-avatar

sei.

输入输出长度不固定?你这用全连接层搭的网络对吧
你可以考虑用类似one hot encoding的方式把输入输出映射为一个定长向量
向量长度就是你这个问题中会遇到的最长长度映射后的向量长度
Jahmobbin-avatar

Jahmobbin

[quote][pid=573314782,29838786,1]Reply[/pid] Post by [uid=60602729]Extreme2018[/uid] (2021-12-14 01:42):

输入输出长度不固定?你这用全连接层搭的网络对吧
你可以考虑用类似one hot encoding的方式把输入输出映射为一个定长向量
向量长度就是你这个问题中会遇到的最长长度映射后的向量长度[/quote]论文中说是用全连接神经网络搭的,但没有具体的代码。我的初步想法是提取出一个固定维度的特征向量来表示目前样本集合的状态,但怎么将数量变化的样本集合提取成维度固定的特征向量又成了问题。

one hot encoding是什么?求大佬详细说说,之前没接触过,百度上说的也不是特别清楚,万分感谢!
dinosquads-avatar

dinosquads

总共多少个样本点?
Jahmobbin-avatar

Jahmobbin

[quote][pid=573317070,29838786,1]Reply[/pid] Post by [uid=61198470]ZRHonor[/uid] (2021-12-14 02:11):

总共多少个样本点?[/quote]一千多个,每进行一次减少一个,最终变成一个
dinosquads-avatar

dinosquads

[quote][pid=573317212,29838786,1]Reply[/pid] Post by [uid=39836537]雪国戎装。[/uid] (2021-12-14 02:13):

一千多个,每进行一次减少一个,最终变成一个[/quote]缺多少补多少0,补到相同长度,最后的结果取有用的部份
aguS-avatar

aguS

也许网络输入是两个样本点,对每对样本点都跑一次网络呢

不定长输入的话考虑下transformer框架?
plebenant-avatar

plebenant

你不如发个原文链接,还可以有个上下文看
Ttenshi-avatar

Ttenshi

试试补零输入
然后损失函数里加一项,效果是如果将零输入进行聚类的话施加巨量惩罚