Warning: error_log(/data/www/wwwroot/hmttv.cn/caches/error_log.php): failed to open stream: Permission denied in /data/www/wwwroot/hmttv.cn/phpcms/libs/functions/global.func.php on line 537 Warning: error_log(/data/www/wwwroot/hmttv.cn/caches/error_log.php): failed to open stream: Permission denied in /data/www/wwwroot/hmttv.cn/phpcms/libs/functions/global.func.php on line 537
深度學(xué)習(xí)算法工程師的基本要求 熟練掌握python和c++編程,至少熟悉 Caffe 和 /Pytorch 兩種框架。熟練玩轉(zhuǎn)深度學(xué)習(xí)各類模型架構(gòu)使用和設(shè)計(jì)。熟練玩轉(zhuǎn)數(shù)據(jù)的整理和使用,必須深刻理解數(shù)據(jù)在深度學(xué)習(xí)任務(wù)中的地位。
計(jì)算機(jī)視覺學(xué)習(xí)路線資料推送
01 機(jī)器學(xué)習(xí)及OpenCV學(xué)習(xí)路線
想快速入門的話,從自己的經(jīng)驗(yàn)看,可以先不看高等數(shù)學(xué)和線性代數(shù),因?yàn)闄C(jī)器學(xué)習(xí)和深度學(xué)習(xí)中涉及的相關(guān)知識(shí)并不多。
視覺的知識(shí)部分建議分成兩部分學(xué)習(xí),第一部分傳統(tǒng)圖像處理,第二部分基于深度學(xué)習(xí)的圖像處理。
計(jì)算機(jī)視覺的提升不在于搭建模型,而在于不斷調(diào)優(yōu)、改進(jìn)過程中積累的經(jīng)驗(yàn)。
我們?cè)撛趺瘁槍?duì)不同領(lǐng)域的圖像設(shè)置不同的參數(shù)?其中包括卷積核大小、網(wǎng)絡(luò)架構(gòu)、初始權(quán)重等等,不可能拿到一個(gè)模型,既適合醫(yī)學(xué)圖像,又適合人臉識(shí)別,這其中就需要n次從70%的精度調(diào)到95%以上中積累出經(jīng)驗(yàn)。
對(duì)于深度學(xué)習(xí)的學(xué)習(xí)我并不建議,直接就學(xué)習(xí)深度學(xué)習(xí)的相關(guān)知識(shí),畢竟深度學(xué)習(xí)是基于機(jī)器學(xué)習(xí)而來的。
所以在入門CV之前,同學(xué)們最好對(duì)基礎(chǔ)的學(xué)術(shù)課程都有對(duì)應(yīng)的了解,比如數(shù)學(xué)方面的微積分,概率學(xué),統(tǒng)計(jì)學(xué),線性代數(shù)這幾門基礎(chǔ)課程。
在編程語言方面,Matlab,Python,C++,最好熟悉其中2種,因?yàn)橛?jì)算機(jī)視覺離開計(jì)算機(jī)編程是完全行不通的。(python和C++書籍推薦)
02 系統(tǒng)的學(xué)習(xí)以下計(jì)算機(jī)視覺課程
在這里班主任推薦3本經(jīng)典教材:
《 Vision: A Modern 》
《 Vision: and 》
《 Vision: Models, , and 》
這三本教材班主任認(rèn)為是計(jì)算機(jī)視覺最好的入門教材了,內(nèi)容豐富,難度適中,其中第二本書涉及大量的文獻(xiàn),很適合對(duì)計(jì)算機(jī)視覺沒什么概念的同學(xué)。這三本教材都不建議讀中文版,有些地方的翻譯不是很合適。
03 繞不開的數(shù)字圖像處理
數(shù)字圖像處理(Digital Image )是通過計(jì)算機(jī)對(duì)圖像進(jìn)行去除噪聲、增強(qiáng)、復(fù)原、分割、提取特征等處理的方法和技術(shù)。
入門的同學(xué)推薦岡薩雷斯的《數(shù)字圖像處理》《數(shù)字圖像處理(第3版)(英文版)》和對(duì)應(yīng)的Matlab版本。一本講基礎(chǔ)的理論,一本講怎么用Matlab實(shí)現(xiàn)。
《OpenCV3編程入門》書本配套源代碼
04 貫穿始終的模式識(shí)別
模式識(shí)別(Pattern ),就是通過計(jì)算機(jī)用數(shù)學(xué)技術(shù)方法來研究模式的自動(dòng)處理和判讀。我們把環(huán)境與客體統(tǒng)稱為“模式”。
計(jì)算機(jī)視覺很多東西都是基于圖像識(shí)別的,圖像識(shí)別就是模式識(shí)別的一種。
模式識(shí)別通常是訓(xùn)練一個(gè)模型來擬合當(dāng)前的數(shù)據(jù),當(dāng)我們拿到一堆數(shù)據(jù)或圖片,需要從當(dāng)中找到它們的關(guān)系,最便捷的便是用模式識(shí)別算法來訓(xùn)練一個(gè)模型。
班主任推薦一本模式識(shí)別入門級(jí)的教材《模式分類》,相對(duì)于《模式識(shí)別》這本書來說可能比較難,但書中介紹了很多模式識(shí)別經(jīng)典的分類器,還是很值得一讀。
什么是卷積?卷積就是兩個(gè)函數(shù)之間的相互關(guān)系,然后得出一個(gè)新的值,他是在連續(xù)空間做積分計(jì)算,然后在離散空間內(nèi)求和的過程。
同學(xué)們可以試著學(xué)習(xí)下CNN在計(jì)算機(jī)視覺當(dāng)中的應(yīng)用,推薦大家薦斯坦福的CS231n課程:深度學(xué)習(xí)與計(jì)算機(jī)視覺。
我建議開始看吳恩達(dá)老師的《機(jī)器學(xué)習(xí)》課程,這個(gè)課程相信許多人已經(jīng)快推薦爛了,但是我依然覺得必須推薦,畢竟這是我的第一位入門導(dǎo)師(我是出身機(jī)械專業(yè)的,都沒有編程基礎(chǔ)的小辣雞,狗頭)。
B站鏈接:()
看《機(jī)器學(xué)習(xí)》課程的時(shí)候,我覺得有必要練習(xí)一下課后習(xí)題,利用Python進(jìn)行編寫。
對(duì)了,在看《機(jī)器學(xué)習(xí)》的時(shí)候,里面會(huì)有編程的內(nèi)容建議略過,因?yàn)槔锩娴木幊陶Z言不是Python更像是低配版的Matlab。
對(duì)于Python的學(xué)習(xí)我看了很多,讓我推薦一個(gè)我還真不好推薦,那就建議看看廖雪峰老師的官網(wǎng)的Pyhon教學(xué)吧,建議看看前面的基礎(chǔ)就行,不用深究,慢慢的就會(huì)了。這里想說一下,其實(shí)都是直接先動(dòng)手過一遍,再慢慢去弄明白原理。有些東西上來沒辦法直接理解,只能慢慢熟悉了再去理解!
鏈接:()
想看視頻的話,我也不知道推薦看誰的好,自己在B站找個(gè)比較符合自己口味的就OK!
課后習(xí)題推薦看B站一位小姐姐的課程,基礎(chǔ)太差感覺自己編寫的話很費(fèi)時(shí)間的。參考一下,把代碼敲一遍也算是把Pyhton編程語言學(xué)了一遍。
B站鏈接:()
學(xué)習(xí)完之后我覺得可以看點(diǎn)OpenCV的基礎(chǔ)知識(shí)
05 深度學(xué)習(xí)學(xué)習(xí)路線
深度學(xué)習(xí)的話,我還是建議先看吳恩達(dá)老師的《深度學(xué)習(xí):》,比較適合零基礎(chǔ)的同學(xué)。
B站鏈接:()
學(xué)習(xí)完理論知識(shí)記得需要強(qiáng)化一下動(dòng)手能力,推薦比較適合零基礎(chǔ)的同學(xué),看這個(gè)PyTorch教程,快速入門了解神經(jīng)網(wǎng)絡(luò)架構(gòu)PyTorch,進(jìn)行網(wǎng)絡(luò)搭建。(B站up主:小土堆)講的很不錯(cuò)很詳細(xì)哦~!
B站鏈接:()
看完之后再看李宏毅老師的21版最新的《深度學(xué)習(xí)》,20版也不錯(cuò)哦~!這個(gè)視頻里面也會(huì)講到PyTorch的知識(shí),相當(dāng)于鞏固了一下。
B站鏈接:()
另外再學(xué)學(xué)李沫老師的《動(dòng)手學(xué)習(xí)深度學(xué)習(xí)》
B站鏈接:()
學(xué)習(xí)pytorch和了,莫煩的還有他們的官方文檔都很詳細(xì),你可以選擇去看。我當(dāng)時(shí)是買的書,pytorch 的我買的博文的:深度學(xué)習(xí)入門之——pytorch,的我買的機(jī)械工業(yè)出版社的深度學(xué)習(xí)之入門,原理與進(jìn)階實(shí)戰(zhàn)。這兩本都很適合入門。
推薦資料:
莫凡教程系列之PyTorch :
中文社區(qū):
總結(jié)
好啦,說了這么多,替大家總結(jié)了一份簡(jiǎn)潔的學(xué)習(xí)路線圖。希望能夠幫助大家,畢竟在這條道路上沒人指導(dǎo)真的很難!當(dāng)初自己就學(xué)的很累!
06 復(fù)現(xiàn)論文
嘗試閱讀和復(fù)現(xiàn)如下文章,你將受益匪淺。助前行,希望對(duì)大家有所幫助。
網(wǎng)絡(luò)架構(gòu)
AlexNet:
ZFNet:
VGG16:
ResNet:
:
:
:
:
語義分割
FCN:
SegNet:
UNet:
PSPNet:
DeepLab:
ICNet:
ENet:
生成對(duì)抗網(wǎng)絡(luò)
GAN:
DCGAN:
WGAN:
Pix2Pix:
:
目標(biāo)檢測(cè)
RCNN:
Fast-RCNN:
Faster-RCNN:
SSD:
YOLO:
:
實(shí)例分割
Mask-RCNN:
YOLACT:
姿態(tài)估計(jì)
PoseNet:
:
原文鏈接:
*請(qǐng)認(rèn)真填寫需求信息,我們會(huì)在24小時(shí)內(nèi)與您取得聯(lián)系。