Warning: error_log(/data/www/wwwroot/hmttv.cn/caches/error_log.php): failed to open stream: Permission denied in /data/www/wwwroot/hmttv.cn/phpcms/libs/functions/global.func.php on line 537 Warning: error_log(/data/www/wwwroot/hmttv.cn/caches/error_log.php): failed to open stream: Permission denied in /data/www/wwwroot/hmttv.cn/phpcms/libs/functions/global.func.php on line 537
平教授是加拿大西蒙弗雷澤大學副教授。不久前他與浙江大學合作了一系列三維視覺課程,內(nèi)容涵蓋相機標定、多視幾何等多個方面。機器之心簡要介紹了該系列課程,希望能夠?qū)ψx者學習三維視覺技術(shù)有所幫助。
課程內(nèi)容簡介
任何把相機連接到計算機的工作都不能忽視三維視覺。近年來,視覺 SLAM 技術(shù)發(fā)展勢頭迅猛,AR/VR、無人機、機器人、自動駕駛方面的公司都在大量招聘了解這方面技術(shù)的人,但熟悉該領(lǐng)域的人才卻非常稀缺。
譚平教授表示,2016 年他在北京篩選了近 200 份簡歷,最后只發(fā)出去兩個 SLAM算法崗的 offer。許多人只是用過開源代碼,有的對代碼做過一些定制化,但對算法的原理了解很少。比如,很少有人能說清楚為什么 ORB SLAM 需要兩種不同的初始化方式,也沒有多少人能講清楚旋轉(zhuǎn)矩陣的參數(shù)化方式。
因此,譚平教授借在浙江大學講課的機會,把三維視覺部分的課程錄像發(fā)布在網(wǎng)絡上,同時也共享了講課的 PPT。
該課程一共是三周的課時,時長約六小時。內(nèi)容涵蓋相機標定、多視幾何、structure-from-motion、SLAM 等方面。課程適合初學者或是想回顧基礎(chǔ)知識的同學。
下面我們將簡單介紹其中的一節(jié)課 SLAM。
SLAM 技術(shù)
SLAM 的全稱是 Simultaneous Localization And Mapping,是一種幫助機器人實現(xiàn)定位與地圖構(gòu)建功能的方案或技術(shù)。它早期用于軍事核潛艇中的海底定位,現(xiàn)在廣泛應用于機器人、無人機、自動駕駛、VR 和 AR 領(lǐng)域。
譚平教授主要從三部分介紹 SLAM 技術(shù):基于激光雷達的 SLAM(LiDAR SLAM)、視覺 SLAM(Visual SLAM),以及提升穩(wěn)健性的技術(shù)(Robustness Techniques)。譚教授希望首先通過 LiDAR SLAM 的講解帶大家了解 SLAM 的基礎(chǔ)模塊,然后了解如何用視覺方法實現(xiàn)這些基礎(chǔ)模塊,即實現(xiàn) Visual SLAM,最后介紹 Visual SLAM 里面用于提升穩(wěn)健性的常用技術(shù)。
譚平教授首先簡要介紹了 SLAM 的基礎(chǔ)概念、視覺 SLAM 的 demo 及應用場景。之后以 2D LiDAR SLAM 為例,介紹了 SLAM 中的基礎(chǔ)模塊。
此外,譚平教授還介紹了 LiDAR SLAM 和 Visual SLAM 的基礎(chǔ)架構(gòu)。
這節(jié)課的第二部分介紹了 Visual SLAM,主要探討了 Visual SLAM by SfM(SfM 在前一節(jié)課中已經(jīng)詳細介紹過)、Key‐frame based VisualSLAM、Parallel Tracking and Mapping (PTAM)。其中重點介紹了 PTAM 的原理和具體步驟。
在這節(jié)課的第三部分,譚教授講解了 Re‐localization、解決 Drifting 問題的 Loop Closure 等提升穩(wěn)健性的技術(shù)。視覺 SLAM 面臨很多挑戰(zhàn),因此需要這些高級功能來提升它的穩(wěn)健性。
最后,譚教授簡要回顧了視覺 SLAM 的歷史,感興趣的同學可查看課件中總結(jié)的研究。
講師簡介
譚平博士是加拿大西蒙弗雷澤大學 (SFU) 副教授,在此之前是新加坡國立大學 (NUS) 副教授。譚博士于 2007 年從香港科技大學獲得博士學位,一直從事計算機視覺,特別是三維重建、視覺 SLAM 方面的研究工作。他是 IJCV、CGF、MVA 等學術(shù)雜志的副主編,并擔任計算機視覺、圖形學、機器人方面的學術(shù)會議領(lǐng)域主席,包括 CVPR 領(lǐng)域主席,SIGGRAPH、SIGGRAPH Asia 的程序委員,IROS 的副主編。
軟預告將于今年 6 月為網(wǎng)頁版 PowerPoint 引入新語音識別功能,可以監(jiān)聽 PowerPoint 視頻中的音頻,并自動生成字幕。
微軟于 2023 年 12 月增強網(wǎng)頁版 PowerPoint,讓用戶在視頻中插入字幕,不過現(xiàn)階段僅支持 WebVTT 格式。
微軟表示待該功能生效后,用戶在演示文檔中插入視頻后,就可以點擊字幕選項,在該功能支持的 63 種語言,滾動選擇最適合視頻的語言,然后點擊生成字幕。
該公司表示,該功能將在 PowerPoint 應用程序中掃描一段兩小時的視頻,并在幾分鐘內(nèi)生成字幕。完成后,用戶可以點擊“編輯字幕”按鈕,對自動字幕進行修改。當用戶看到需要編輯的字幕部分時,視頻會自動播放。
(來源:IT之家)
軟預告將于今年 6 月為網(wǎng)頁版 PowerPoint 引入新語音識別功能,可以監(jiān)聽 PowerPoint 視頻中的音頻,并自動生成字幕。
微軟于 2023 年 12 月增強網(wǎng)頁版 PowerPoint,讓用戶在視頻中插入字幕,不過現(xiàn)階段僅支持 WebVTT 格式。
微軟表示待該功能生效后,用戶在演示文檔中插入視頻后,就可以點擊字幕選項,在該功能支持的 63 種語言,滾動選擇最適合視頻的語言,然后點擊生成字幕。
該公司表示,該功能將在 PowerPoint 應用程序中掃描一段兩小時的視頻,并在幾分鐘內(nèi)生成字幕。完成后,用戶可以點擊“編輯字幕”按鈕,對自動字幕進行修改。當用戶看到需要編輯的字幕部分時,視頻會自動播放。
(來源:IT之家)
*請認真填寫需求信息,我們會在24小時內(nèi)與您取得聯(lián)系。