我是一个平平无奇的AI神经元

我是一个AI神经元

我是一个AI神经元,刚刚来到这个世界上,一切对我来说都特别新奇。

之所以叫这个名字,是因为我的工作有点像人类身体中的神经元。

人体中的神经元可以传递生物信号,给它输入一个信号,它经过处理后再输出一个信号传递给别的神经元,最终传递到大脑完成对一个信号的决策和处理。

聪明的计算机科学家们受到启发,在代码程序里发明了我: 神经元函数

在我们的世界里,我只是普普通通的一员,像我这样的神经元有成百上千,甚至上万个,我们按照 的形式,组成了一个庞大的 神经网络

很快我和隔壁工位的大白开始混熟了,他比我来得早,对这里要熟悉的多。

神经元结构

在大白的指引下,我很快就学会了怎么工作。

展开全文

虽然我们叫神经元,名字听起来挺神秘的,但实际上我就是一个普通函数,有参数,有返回值,普通函数有的我都有:

defneuron(a):

w = [...]

b = ...

...

我有一个参数 a,这个参数是一个数组,里面的每一个元素我把它分别叫做a1,a2,a3···用这个a来模拟我这个神经元收到的一组 信号

人类的神经元是怎么处理输入的生物信号我不知道,我估计挺复杂的。但在我这里就很简单:我给每一个输入值设定一定的 权重,然后做一个简单的 加权求和,最后再加上一个偏移值就行啦!

所以我还有一个数组叫做 w,就是权重 weight的意思,里面的每一个元素我叫做w1,w2,w3···,至于那个偏移值,就叫它 bias

如此一来我的工作你们也该猜到了,就是把传进来的a里面的每个元素和w里的每一个元素做乘法,再加起来,最后加上偏移值,就像这样:

说到这里,我突然想到一个问题,打算去问问大白。

“大白,这些要计算的数据都是从哪里来的呢?”

“是上一层的神经元们送过来的”

“那他们的数据又是哪来的呢?”,我刨根问题的问到。

大白带我来到了门口,指向另外一个片区说到,“看到了吗?那里是数据预处理部门,他们负责把输入的图片中的像素颜色信息提取出来,交给我们神经网络部门来进行分析。”

“交给我们?然后呢”

神经网络训练

正聊着,突然,传来一阵广播提示音,大家都停止了闲聊,回到了各自工位。

“这是要干啥,这么大阵仗?”,我问大白。

“快坐下,马上要开始训练了”,大白说到。

“训练?训练什么?”

“咱们用到的那些权重值和偏移值你以为怎么来的?就是通过不断的训练得出来的。”

还没说到几句话,数据就开始送过来了。按照之前大白教给我的,我将输入数据分别乘以各自的权重,然后相加,最后再加上偏移bias,就得到了最后的结果,整个过程很轻松。

我准备把计算结果交给下一层的神经元。

大白见状赶紧制止了我,“等一下!你不能直接交出去”

“还要干嘛?”

大白指了一下我背后的另一个家伙说到:“那是 激活函数,得先交给他处理一下”

“激活函数是干嘛的?”,我问大白。

激活,就是根据输入信号量的大小去 激活产生对应大小的输出信号。这是在模仿人类的神经元对神经信号的反应程度大小,好比拿一根针去刺皮肤,随着力道的加大,身体的疼痛感会慢慢增强,差不多是一个道理。”

听完大白的解释,我点了点头,好像明白了,又好像不太明白。

后来我才知道,这激活函数还有好几种,经常会打交道的有这么几个:

sigmoid

tanh

relu

leaky relu

sigmoid

tanh

relu

leaky relu

sigmoid

tanh

relu

leaky relu

激活函数处理完后,总算可以交给下一层的神经元了,我准备稍事休息一下。

刚坐下,就听到大厅的广播:

随后,又来了一组新的数据,看来我是没时间休息了,赶紧再次忙活了起来。

这一忙不要紧,一直搞了好几个小时,来来回回重复工作了几万次,我都快累瘫了。

损失函数 & 优化方法

趁着休息的空当,我又和大白聊了起来。

“大白,刚刚咱们这么来来回回折腾了几万次,这是在干啥啊?”

大白也累的上气不接下气,缓了缓才说到:“这叫做网络训练, 通过让我们分析大量不同品种狗的图片,让我们训练出合适的权重和偏移值,这样,我们就变得会认识狗品种了,以后正式工作的时候给我们新的狗的图片,咱们也能用学到的知识去分辨啦!

“那到底是怎么训练的,你给我说说呗”,我继续问到。

“不断尝试修改?这么多神经元,难不成看运气瞎碰?”

大白给了我一个白眼,“怎么可能瞎试,那得试到猴年马月去了。咱们这叫深度学习神经网络,是能够自学习的!”

他这么一说我更疑惑了,“怎么个学习法呢?”

“额,听上去好像很简单,不过我还有好多问题啊。怎么去衡量这个差距呢?具体怎么调整权重偏移呢?调整幅度该多大好呢?”,我小小的脑袋一下冒出了许多的问号。

大白脸上露出了不可思议的表情,“小伙子,不错嘛!你一下问出了神经网络的三个核心概念。”

“是哪三个?快给我说说”

大白喝了口水,顿了顿接着说到,“首先,怎么去衡量这个差距?这个活,咱们部门有个人专门干这活,他就是 损失函数,他就是专门来量化咱们的输出结果和实际结果之间的差距。量化的办法有很多种,你空了可以去找他聊聊”

“那第二个呢?”

“第二个,具体怎么调整,这也涉及到咱们神经网络中一个核心概念,他就是 优化方法,咱们部门用的最多的是一个叫 梯度下降的方法。那玩意儿有点复杂,一时半会儿给你说不清楚,大概差不多就是用求导数的方式寻找如何让损失函数的损失值变小”,大白继续耐心的解释着。

“好吧,那第三个核心概念是什么?”

“你刚不是问调整幅度吗?这个调整幅度太小了不行,这样咱们训练的太慢了,那得多训练很多回。太大了也不行,要是一不小心错过了那个最优值,损失函数的结果就会来回摇摆,不能 收敛,所以有一个叫 学习速率的数值,通常需要程序员们凭借经验去设定”

我还沉浸在大白的讲解中,广播声再次响起:

看来程序员修改了学习速率,我只好打起精神,继续去忙了,真不知道何时才能训练达标啊~

END

看你有没有被Cue到?

觉得不错,请点个在看

也许你还喜欢

视频号:加速商业化与塑造“1+N”契

不疾不徐,微信视频号将迎来自己两周岁生日。 作为社交软件巨头微信在短视频时代“单刀

轻量化应用,秒级响应?扫码报修小程序

智汇故障报修小程序,无需要下载,无需安装扫码即报修。解决传统报修中,工单不容易管理,维修

原厂芯片验证十二:禾芯微-HX3033A D

今天是2022年1月16日,今天为大家分享已经名言是: 读过一本好书,像交了一个益友。 每一年

Counterpoint:iPhone连续6周在中国

集微网消息,1月13日,据Counterpoint Research数据,苹果在中国连续六周保持着智能手机销售

一加 8/8T 系列 ColorOS 12 升级公

IT之家 1 月 16 日消息,感谢IT之家网友热心线索投递,一加 8 系列(OnePlus 8、OnePlus 8 P

流量造假、大数据杀熟,行不通了!用户

国家互联网信息办公室、工业和信息化部、 公安部、国家市场监督管理总局联合发布 《互

路名怎么腾讯地图标注道路修改名称

路名怎么腾讯地图标注道路修改名称地址位置,没有很不方便如果不懂得话你可以看看视频。

Torah登陆全球最大行情网站CoinMar

1月15日,全球第一条赋能分布式能源管理的去中心化存储生态应用公链—Torah正式登陆全球

《黑客帝国:矩阵重启》现实vs虚拟,哪

人类大脑有140亿个活跃神经元,比之苹果M1芯片复杂50倍,正因如此,我们可以创造出两个世界,

《广电MCN发展报告》

经过三年多的发展,广电MCN这种模式已经在广电系铺开和跑通,且运作模式不断衍生、升级。