亚洲精品2区,一区二区三区免费观看视频,久久丁香综合五月国产三级网站

您當前的位置：首頁 > 科技新聞

生物老師：數學老師，你走開，這道題我來解！

發布時間：2024-05-25 10:58:32 來源：中國科普博覽字號： [ 大 ] [ 中 ] [ 小 ]

自然界是人類創新靈感的不竭源泉。自然界生物具有非凡的適應能力和智慧：蟻群如何找到距離食物源的最短路徑，大雁覓食時怎么飛距離最短，生物怎么進化出各種性狀……合理利用這些規律，可以處理……數學問題？

（圖片來源：veer圖庫）

沒錯，而且是處理傳統數學理論不易解決的問題。

優化問題與啟發式算法

首先，來看個數學問題：

計算如下一元二次函數的最值

對這種簡單的目標函數，可直接套用公式：當自變量x=-b/2a時，目標函數的最值為（4ac-b^2）/4a（忘了請自行聯系高中數學老師）。這種能直接表達為公式的解，稱為解析解（Analytic Solution）。

對于簡單問題，可一步得到答案

這種求某函數的最大值/最小值的問題，就是優化問題，這一函數稱為目標函數（Objective Function）。優化算法，就是計算目標函數最值的算法。

實際中，優化問題的目標函數往往比較復雜，無法得到解析解，因此常利用梯度（多元函數的導數），進行迭代求解。

然而，對于某些更為復雜的目標函數，無法使用梯度方法。例如，計算如下函數的最小值

復雜的目標函數，無法套用公式

若利用常規的梯度方法，容易收斂于局部最優（Local Optimum），即某一范圍內的最值點，而不是全局最優（Global Optimum），即全局范圍內的最值點。

梯度方法容易陷入局部最優

優化類似的復雜函數，一直是難點問題。科學家在受到某些自然規律的啟發后，模擬自然體算法，提出了若干啟發式算法（Heuristic Algorithm），用于處理傳統數學理論不易解決的優化問題。

例如，模擬蟻群尋找、搬運食物的規律，提出蟻群算法（Ant Colony Algorithm）；模擬大雁在空中覓食的規律，提出粒子群優化算法（Particle Swarm Optimization Algorithm）；模擬生物遺傳與進化規律，提出遺傳算法（Genetic Algorithm）……

算法科學家怎么看生物遺傳與進化？

本文介紹的啟發式算法，是模擬生物遺傳與進化規律提出的，那么，算法科學家眼中的遺傳與進化是怎樣的？這里先以長頸鹿的進化為例（注意，遺傳算法只是對已知進化規律的模仿，并不一定等同于生物規律）。

自然界的生物多種多樣，其性狀由基因和外部因素共同決定，但基因占主導作用，因此這里忽略外部因素。例如，基因確定，長頸鹿的脖子長短也隨之確定。

基因是生物的遺傳物質，由多位核苷酸組成，類似于“AaBbCc”。種群的進化，必然意味著基因的變化。

自然選擇并不直接作用于基因，而是作用于性狀。個體的性狀不同，其生存能力不同。例如，鹿脖子越長，吃到的樹葉越多，生存能力越強。將生存能力進行量化，稱為適應度。

適應度本應由多個因素共同決定，例如鹿的脖子長短、體力、視力等因素。但這里僅考慮脖子長短，脖子越長，適應度越高。

（本文默認：基因決定性狀，再決定生存能力）

從前，有群普通的鹿，大家的基因各不相同，因此性狀也不同（這里的性狀特指脖子長短），將這一代的鹿群記為“鹿群0”。

在“鹿群0”中，脖子長的個體能吃到更多的樹葉，更可能生存下去，因此適應度高。而脖子短的個體更可能被淘汰，適應度低。將這一過程稱為選擇，經過選擇生存下來的鹿才能夠進行交配。

（圖片來源：望墨溢，一位靈魂畫家）

雄鹿在與雌鹿交配時，不是簡單地復制自己的基因，而是與雌鹿的基因發生交叉后再結合（這里認為基因=染色體）。例如，“Aa BbCc”+“aa bbcc”=“Aa bbcc”+“aa BbCc”。

當然，在兩條基因進行結合時，基因的一位或若干位核苷酸可能發生變異。例如，某位基因b變異成B。

基因交叉

基因變異

這樣，“鹿群0”就產生了新的一代，記為“鹿群1”。一般而言，經過選擇處理的“鹿群1”，適應度的最大值和平均值會提高，也就是脖子長短的最大值和平均值有所提高。

經過一代又一代的繁衍，由于基因的變化，“鹿群N”的脖子將會顯著長于“鹿群0”，適應度更高。這時，我們可以說物種進化了。

種群趨向最優

當然，最優的脖子長短還與環境有關，這里環境特指樹冠高度。脖子高于樹冠，沒有好處反而有壞處。而只要環境不發生顯著變化，“鹿群N”之后，種群的基因不會發生顯著變化，適應度也不會發生顯著變化，種群穩定在最優解。

遺傳算法，到底怎么算？

美國的John Holland，模擬達爾文生物進化論的自然選擇和遺傳學機理，提出一種啟發式優化算法——遺傳算法。

該算法將自變量轉換成個體，通過編碼將個體與基因對應起來，將待求解的目標函數作為適應度函數，保留了交叉、變異，經多次迭代后，可使種群（多個個體）趨于最優解。

以求解目標函數F(x)=x+8sin(5x)+5cos(4x)的最大值為例，遺傳算法會分六步走來解決問題：

1. 初始化

遺傳算法將自變量可能的取值視為個體，在設置好種群總數后，生成初始化種群。例如，設置種群個體共100個，在[0,8]區間內隨機選擇100個初始值。

在自變量的某個區間內，隨機生成初始種群

2. 編碼與解碼

自變量個體本身無法視為基因，需將其進行某種轉換，通常將個體轉換為一串二進制的數，稱為編碼，這串二進制的數即可視為基因。

例如，規定用4位二進制表示整數部分，用2位二進制表示小數部分，則3.25可表示為“001101”，“001101”就是該個體的基因。

個體的3.25的二進制表示001101，就是對基因的模擬

編碼是為了模擬基因，從而進行后續的交叉、變異。而解碼，就是將基因（二進制）再轉換為個體（十進制）。十進制數才能代入適應度函數中，從而計算適應度。

3. 適應度計算

但在將基因（二進制）轉化為個體（十進制）后，將十進制個體代入目標函數，即可得到適應度。

不難理解，適應度函數常常就是待求解的目標函數F(x)=x+8sin(5x)+5cos(4x)。

4. 選擇

每個個體，根據適應度大小，進行選擇。適應度大的，更可能被保留下來，適應度小的，更可能被淘汰。這一過程，通常用“輪盤賭”模型進行。

當然，在選擇的過程中，我們還得保證個體數量不變。為保證這一點，適應度大的，不僅被保留，還會被復制。

適應度大的個體自然更可能存活

5. 交叉與變異

保留下來個體，經編碼得到基因后，進行交叉。例如，“001 101”+“010 010”=“001 010”+“010 101”。一般而言，交叉點是隨機選擇的。

這里，兩個基因交叉得到兩個新的基因（相當于父母必生雙胞胎）。因此，交叉不改變種群數量。

在交叉后，每個基因還可能發生變異。一般而言，變異點也是隨機的。例如，某位的1變為0，或0變為1。

二進制數的交叉

二進制數的變異

在經過選擇后，相比前一代，種群適應度的最大值和平均值都會有所提高。具體而言，就是所有的個體都會向目標函數的高處集中。經多次迭代后，就會集中于最大值處。

6. 是否結束

既然是優化算法，必然需要設置結束條件，不能讓算法無限次地循環下去（死循環）。最簡單的方法，就是設置算法運行次數。例如，令算法循環50次后結束。

這里給出遺傳算法一般的流程圖

隨著進化的進行，即算法的循環，種群的平均適應度勢必逐代提高，最終收斂于某一最大值，這一點就是我們要找的目標函數的最大值點。

遺傳算法循環50次后的種群分布：集中于一點

隨著算法的迭代，種群的平均適應度也在提高

每一步都有小策略

要想提高遺傳算法的效率，在上述步驟中其實都有小技巧。

1.初始化

若可獲得關于最值點的先驗信息，即最值點所在的大致范圍。則可在這一范圍內生成初始種群。若沒有，則需要在更大范圍內隨機生成。

初始值的選擇，會影響算法的收斂速度。初始值選得越靠近最優解，收斂速度越快。另外，不合適的初始值，可能使得算法陷入局部最優。

這樣是不是能更快地找到最優解~

2. 編碼與解碼

在數字信號處理中，度量必然存在最小值和最大值，即變量的取值不是連續、無限的，而是不連續，有限的，由于度量產生的誤差稱為量化誤差（Quantization Error）。

例如，我們用4位二進制表示整數部分，用2位二進制表示小數部分，那么自變量最大只能取15.75（對應二進制為111111），且小數部分只能分辨出0.25的差異。度量的最小值又被稱為分辨率（Resolution Ratio）。

F(x)=x+8sin(5x)+5cos(4x)的最優解在7.860處，但算法只能收斂于7.875

當然，我們可令基因的長度很長，例如用100位二進制表示整數部分，10位二進制表示小數部分，即可擴大自變量取值范圍，提升分辨率。然而，這樣會增加算法的運算量和存儲量。

3. 選擇

在選擇過程中，若一定保留、復制適應度最高的個體，則稱為精英保留（Elite Reservation）；若不一定保留適應度最高的個體，其依舊有可能被淘汰，則稱無精英保留。

實驗證明，有精英保留的遺傳算法，收斂至最優值的速度更快，且更為穩定。

4. 交叉與變異

交叉可分為單點交叉，也可多點交叉，變異也可分為單點變異和多點變異。交叉和變異是為了提高基因多樣性，加速收斂速度，且可跳出局部最優。

例如，當所有個體都集中至局部最優附近時，突然有個個體變異了，“跳”至全局最優附件，則種群就可進一步進化。

對于種群而言，穩定比多樣更為重要，因此交叉和變異往往單點進行即可，且變異概率往往非常低。

5. 是否結束

通過設置算法運行次數，來控制算法結束，雖然簡便，但存在如下兩個問題：

（1）若算法收斂較慢，例如50次并未使得種群集中到某一最優解，那么結果必然不正確；

（2）若算法收斂較快，例如20次即可使得種群集中到某一最優解，那么就浪費了很多的計算資源。

另一種更為可靠的方法，是判斷相鄰2次運算間，種群的平均適應度差異大小，即是否小于某個門限。如果是，則認為算法已經收斂，可終止；如果否，則認為算法還未收斂，應繼續循環。

根據平均適應度差異來控制算法終止，更為可靠

遺傳算法不僅能畫畫，還能告訴你這些

以遺傳算法為例的啟發式算法，沒有極其嚴格的數學推導，但自然界已用這些規律解決了無數的問題?，F在，遺傳算法已廣泛應用于我們生活中的多個領域，例如，如何設計車輛外形，以減少空氣阻力；如何安排機器人的工作流程，以提高工作效率；如何進行線路規劃，使快遞運輸路程最短……

之前，有人在GitHub上傳了一個項目，就是用遺傳算法來繪制特定的圖片，下面是一個仿真實例，看遺傳算法是如何對照上面的照片“畫”出下面的作品的：

（圖片來源：https://github.com/anopara/genetic-drawing）

首先，給出多個初始色條，組成色條畫面，并以色條畫面與原圖片的差作為目標函數。然后利用遺傳算法，迭代求解色條的排列，使得目標函數最小，即色條畫面與原圖片“最像”，從而實現用多個色條“畫”出原圖片。

PS：如果你不是碼農，暫時也不需要用到遺傳算法，但是仍可從遺傳算法中學到若干智慧：

●沒有完美的算法，保證精度，就得增加計算量。一切策略，都是在多個因素間尋找平衡的藝術。

●只追求穩定，會無法進步；只追求多樣，會無法積累優勢。因此，我們需要在穩定和多樣間尋找平衡。但是，從長遠來看，穩定（積累、傳承）往往比多樣更重要一些。

●精英保留很重要，但也絕不能輕視精英以外的普通個體。沒有普通個體，變異就失去了土壤，種群也就走向了單調。而單調，往往意味著脆弱。

參考文獻：

[1] 鄭樹泉. 工業智能技術與應用[M]. 上海: 上?？茖W技術出版社.

[2] 李德毅, 于劍. 中國科協新一代信息技術系列叢書人工智能導論[M]. 北京: 中國科學技術出版社.

作者：望墨溢

作者單位：西北工業大學航海學院

本文來源于“科學大院“公眾號，轉載請注明公眾號出處

上一篇：畢業找不到工作，就是失敗者？這 5 個“危險誤區”，正悄悄吞噬年輕人的心理健康

下一篇：返回列表

【免責聲明】本文轉載自網絡，與科技網無關?？萍季W站對文中陳述、觀點判斷保持中立，不對所包含內容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考，并請自行承擔全部責任。

亚洲二区三区在线,久久久久高清毛片一级,亚洲综合一区二区三区不卡,中文不卡av

生物老師：數學老師，你走開，這道題我來解！

生物老師：數學老師，你走開，這道題我來解！