擊敗谷歌! 微軟圖像識別系統準確率排名第一
發布者:發布時間:2016-01-11 15:57:56點擊次數:
騰訊科技訊 12月11日,在日前舉辦的第六屆“ImageNet圖像識別大賽”(ImageNet image recognition competition)中,
微軟研究院的計算機圖像識別系統成功在幾個類別的測試中取得了第一名的好成績,同時也擊敗了包括
谷歌(
微博)、
英特爾、
高通以及其他一些初創企業和學術實驗室的產品。
據悉,微軟在此次比賽中所使用的系統名為“圖像識別深度殘差學習”(Deep Residual Learning for Image Recognition),該系統由微軟研究員何愷明、張祥雨、任少卿和孫劍(均為音譯)組成的團隊開發。微軟在官方博客中表示,公司將在今后發表的論文中詳細對外介紹這一系統。
“我們對神經網絡的訓練深度已經超過了150層,而這一‘深度殘差學習’框架能夠進一步減少優化,同時整合極深度網絡,圖像識別的準確率也就會迎來提升。而且,這種準確率的提升是許多其他普通網絡所無法做到的。”一名微軟研究員如是說道。
應該說,圖像識別技術近期已經得到了越來越多科技公司的追捧,因為他們都希望借這一系統改善內部系統及面向消費者的產品。
值得一提的是,微軟此前已經通過幾款有趣的應用幽默化的展示了公司在這一領域的實力,比如該公司發布了“我看起來有多大”(How Old Do I Look?)以及“我的胡子怎么樣”(How’s My Moustache Doing?)這兩款妙趣橫生的應用。同時,微軟還通過微軟研究院發起的“牛津項目”(Project Oxford)試圖將這一圖像識別技術真正實現商業化。
據悉,第六屆“ImageNet圖像識別大賽”要求參賽方對來自圖片分享網站Flickr和搜索引擎的10萬張照片進行精確定位,并將他們劃分到1000種目標類別下,其中包括狼蛛、iPod、清真寺、玩具店和調制解調器等。比賽中,微軟系統的分類錯誤率僅為3.5%,定位錯誤率則為9%。
而在過去幾年,谷歌、初創企業larifai和NEC則一直在圖像分類準確率方面取得了不錯的成績。
對此,微軟研究院的一名研究人員表示:“甚至連我們自己都敢不相信這一方案能夠取得這么好的成績。”