...继续做关于AI的科普视频:打开模型推理的黑盒

Teeiish-avatar

Teeiish

2025-04-19T00:35:55+00:00

最近还是继续做关于AI的科普视频,这期主要讲一下模型推理时的一些常见参数(比如 temperature, top_p) 的意义,主要的目的呢,算是拨开LLM黑盒的面纱,去去寐。希望对有兴趣的观众有点帮助,如果有帮助的话,还望给一点支持(点赞关注什么的,谢谢!

[[纯干货] (稍微)揭开大模型推理的面纱...] [https://www.bilibili.com/video/BV1SC5HzYEYx/?share_source=copy_web&vd_source=6bb0053af3774659e77bb7f39a9f801b https://www.bilibili.com/video/BV1SC5HzYEYx/?share_source=copy_web&vd_source=6bb0053af3774659e77bb7f39a9f801b]

说实话这种视频真的不好把握深度,上一个视频我还觉得讲的有点太泛泛而谈了,结果大部分的反馈都是太深了。只能按自己的感觉讲了。

上一期:
[[纯干货] 从论文里看出从Transformer到ChatGPT的历史必然性...] [https://www.bilibili.com/video/BV1ZsR9YoEwp/?share_source=copy_web&vd_source=6bb0053af3774659e77bb7f39a9f801b https://www.bilibili.com/video/BV1ZsR9YoEwp/?share_source=copy_web&vd_source=6bb0053af3774659e77bb7f39a9f801b]
BelZayka-avatar

BelZayka

冷知识,调参不等于可解释性
!DenisCepaka-avatar

!DenisCepaka

看了,感觉说的不深。

但是也完全无法留住什么,外行看这还是看个新鲜,除非自己开工去码代码,不然还是一边进一边出

我是做质谱分离分析的,用deepseek尝试过,但是感觉对应的资料太少,ds学到的也太少,没办法像搞代码的一样,教一教它,就能输出能稍作修改就可以使用的代码。它给出的建议尝试过,效果不咋地
Teeiish-avatar

Teeiish

+ by [包子三块五个] (undefined)

看了,感觉说的不深。

但是也完全无法留住什么,外行看这还是看个新鲜,除非自己开工去码代码,不然还是一边进一边出

我是做质谱分离分析的,用deepseek尝试过,但是感觉对应的资料太少,ds学到的也太少,没办法像搞代码的一样,教一教它,就能输出能稍作修改就可以使用的代码。它给出的建议尝试过,效果不咋地

比较偏的门类还是建议用类似RAG的方法,问他问题的时候同时提供你们领域相关的资料(而不完全依赖于模型训练时涉猎过的资料). 不过这种基本上需要API 调用,会比较方便点,而且需要很长的上下文能力. 真的有专业需求的话可以去试试Google的新的一百万上下文能力的模型
Teeiish-avatar

Teeiish

自己顶一下….
Poke-avatar

Poke

我看了第一个视频,怎么说呢,这个算是科普,但更像是调参说明。。。要不直接点讲符号学吧

反正我的观点是LLM是不可能实现人工智能的

你可以看下B站的一个up,贯一智能科技,当然很可惜的是这个up因为把帐号的归属权还给公司了,早期的视频都删了,然后,下面的评论也看不到的了
{love•noko}-avatar

{love•noko}

你能打开黑盒那你能博士毕业了,真的
Teeiish-avatar

Teeiish

+ by [基米德の棉拖孩] (undefined)

你能打开黑盒那你能博士毕业了,真的

CS ML博士毕业好多年了…相关的paper NIPS/ICML/ICRL/KDD/…都发了不少,黑箱哪有那么难开,
BelZayka-avatar

BelZayka

+ by [碎的心] (undefined)

CS ML博士毕业好多年了…相关的paper NIPS/ICML/ICRL/KDD/…都发了不少,黑箱哪有那么难开,

不是我吹牛,我也是cs博,你能开llm的黑箱高低给你个图灵奖哭笑
Teeiish-avatar

Teeiish

+ by [月刀刻] (undefined)

不是我吹牛,我也是cs博,你能开llm的黑箱高低给你个图灵奖哭笑

又没说开llm的黑箱,只是推理.