内容簡介
圖形刺激作用于感覺器官,人們辨認出它是經驗過的某一圖形的過程,也叫圖像再認。在圖像識别中,既要有當時進入感官的信息,也要有記憶中存儲的信息。隻有通過存儲的信息與當前的信息進行比較的加工過程,才能實現對圖像的再認。
相關信息
人的圖像識别能力是很強的。圖像距離的改變或圖像在感覺器官上作用位置的改變,都會造成圖像在視網膜上的大小和形狀的改變。即使在這種情況下,人們仍然可以認出他們過去知覺過的圖像。甚至圖像識别可以不受感覺通道的限制。例如,人可以用眼看字,當别人在他背上寫字時,他也可認出這個字來。
識别基礎
圖像識别可能是以圖像的主要特征為基礎的。每個圖像都有它的特征,如字母A有個尖,P有個圈、而Y的中心有個銳角等。對圖像識别時眼動的研究表明,視線總是集中在圖像的主要特征上,也就是集中在圖像輪廓曲度最大或輪廓方向突然改變的地方,這些地方的信息量最大。而且眼睛的掃描路線也總是依次從一個特征轉到另一個特征上。
由此可見,在圖像識别過程中,知覺機制必須排除輸入的多餘信息,抽出關鍵的信息。同時,在大腦裡必定有一個負責整合信息的機制,它能把分階段獲得的信息整理成一個完整的知覺映象。
在人類圖像識别系統中,對複雜圖像的識别往往要通過不同層次的信息加工才能實現。對于熟悉的圖形,由于掌握了它的主要特征,就會把它當作一個單元來識别,而不再注意它的細節了。這種由孤立的單元材料組成的整體單位叫做組塊,每一個組塊是同時被感知的。在文字材料的識别中,人們不僅可以把一個漢字的筆劃或偏旁等單元組成一個組塊,而且能把經常在一起出現的字或詞組成組塊單位來加以識别。
在計算機視覺識别系統中,圖像内容通常用圖像特征進行描述。事實上,基于計算機視覺的圖像檢索也可以分為類似文本搜索引擎的三個步驟:提取特征、建索引build以及查詢。
相關領域
圖像識别是人工智能的一個重要領域。為了編制模拟人類圖像識别活動的計算機程序,人們提出了不同的圖像識别模型。例如模闆匹配模型。這種模型認為,識别某個圖像,必須在過去的經驗中有這個圖像的記憶模式,又叫模闆。當前的刺激如果能與大腦中的模闆相匹配,這個圖像也就被識别了。例如有一個字母A,如果在腦中有個A模闆,字母A的大小、方位、形狀都與這個A模闆完全一緻,字母A就被識别了。這個模型簡單明了,也容易得到實際應用。
但這種模型強調圖像必須與腦中的模闆完全符合才能加以識别,而事實上人不僅能識别與腦中的模闆完全一緻的圖像,也能識别與模闆不完全一緻的圖像。例如,人們不僅能識别某一個具體的字母A,也能識别印刷體的、手寫體的、方向不正、大小不同的各種字母A。同時,人能識别的圖像是大量的,如果所識别的每一個圖像在腦中都有一個相應的模闆,也是不可能的。
為了解決模闆匹配模型存在的問題,格式塔心理學家又提出了一個原型匹配模型。這種模型認為,在長時記憶中存儲的并不是所要識别的無數個模闆,而是圖像的某些“相似性”。從圖像中抽象出來的“相似性”就可作為原型,拿它來檢驗所要識别的圖像。如果能找到一個相似的原型,這個圖像也就被識别了。
這種模型從神經上和記憶探尋的過程上來看,都比模闆匹配模型更适宜,而且還能說明對一些不規則的,但某些方面與原型相似的圖像的識别。但是,這種模型沒有說明人是怎樣對相似的刺激進行辨别和加工的,它也難以在計算機程序中得到實現。因此又有人提出了一個更複雜的模型,即“泛魔”識别模型。
一般工業使用中,采用工業相機拍攝圖片,然後利用軟件根據圖片灰階差做處理後識别出有用信息,圖像識别軟件國外代表的有康耐視等,國内代表的有圖智能等。
研究現狀
圖像識别的發展經曆了三個階段:文字識别、數字圖像處理與識别、物體識别。文字識别的研究是從1950年開始的,一般是識别字母、數字和符号,從印刷文字識别到手寫文字識别,應用非常廣泛。
數字圖像處理和識别的研究開始于1965年。數字圖像與模拟圖像相比具有存儲,傳輸方便可壓縮、傳輸過程中不易失真、處理方便等巨大優勢,這些都為圖像識别技術的發展提供了強大的動力。物體的識别主要指的是對三維世界的客體及環境的感知和認識,屬于高級的計算機視覺範疇。
它是以數字圖像處理與識别為基礎的結合人工智能、系統學等學科的研究方向,其研究成果被廣泛應用在各種工業及探測機器人上。現代圖像識别技術的一個不足就是自适應性能差,一旦目标圖像被較強的噪聲污染或是目标圖像有較大殘缺往往就得不出理想的結果。
圖像識别問題的數學本質屬于模式空間到類别空間的映射問題。目前,在圖像識别的發展中,主要有三種識别方法:統計模式識别、結構模式識别、模糊模式識别。圖像分割是圖像處理中的一項關鍵技術,自20世紀70年代,其研究已經有幾十年的曆史,一直都受到人們的高度重視,至今借助于各種理論提出了數以千計的分割算法,而且這方面的研究仍然在積極地進行着。
相關軟件
随着手機的攝像功能越來越清晰,很多文件我們都是使用手機拍攝,包括合同,文檔,但是我們需要吧這些圖片能夠變成可編輯的文字,能複制的,這樣工作就很輕松很多,特别是我們需要圖片上面的文字的,這時候圖像識别軟件就顯得尤為重要,捷速圖像識别軟件就是專門解決這種問題的軟件;捷速圖像識别軟件具備識别速度快,準确率高的特點,并且軟件還支持pdf文檔轉換成文字,支持各種格式之間的轉換!
軟件有2種内核選擇模式,一種急速内核,不需要安裝office就可以識别轉換的;另外一種是office内核,需要安裝office10或者以上版本,識别轉化率高并且排版清晰!



















