Tesseract-OCR中如何實現(xiàn)結(jié)構(gòu)化的文檔分析

引言

之前一篇介紹了Tesseract-OCR安裝與測試，已經(jīng)對中文字符的識別支持。大家反饋比較多，所以決定在寫一篇，主要是介紹用它做項目時候需要注意的問題與一些比較重要的函數(shù)使用。主要介紹一下Tesseract-OCR中如何實現(xiàn)結(jié)構(gòu)化的文檔分析以及相關(guān)區(qū)域的定位識別。

術(shù)語名詞

OEM - OCR Engine Mode

Tesseract-OCR從4.x版本開始支持LSTM，可以通過OEM參數(shù)熟悉設(shè)置，oem參數(shù)選項的值與表示分別如下：

0：3.x以前的識別引擎
1：神經(jīng)網(wǎng)絡(luò)LSTM的識別引擎
2：混合模式，傳統(tǒng)+LSTM
3：默認(rèn)，那種支持就用那種

PSM-Page Segmentation Mode

Tesseract-OCR支持對每頁文檔進行結(jié)構(gòu)化分析，并輸出結(jié)構(gòu)化分析的結(jié)果，PSM文檔結(jié)構(gòu)化分析可以獲取很多有用的文檔信息?？傆嬛С?3種模式，默認(rèn)的PSM的選項參數(shù)位PSM_AUTO=3，該選項支持對文檔的結(jié)構(gòu)化輸出信息包括：

dict_keys(['level', 'page_num', 'block_num', 'par_num', 'line_num', 'word_num', 'left', 'top', 'width', 'height', 'conf', 'text'])，其中比較重要的包括：

'left', 'top', 'width', 'height' 表示位置信息
'text' 表示每個的外接矩形左上角與右下角坐標(biāo)
'conf' 表示置信度，值在0~100之間，小于0的應(yīng)該自動排除

其它有用的選項包括：

0   角度與語言檢測，不識別不分析文檔結(jié)構(gòu)
1   角度 + PSM模式

更多模型，懶得翻譯，請直接看下面：

0    Orientation and script detection (OSD) only.
1    Automatic page segmentation with OSD.
2    Automatic page segmentation, but no OSD, or OCR.
3    Fully automatic page segmentation, but no OSD. (Default)
4    Assume a single column of text of variable sizes.
5    Assume a single uniform block of vertically aligned text.
6    Assume a single uniform block of text.
7    Treat the image as a single text line.
8    Treat the image as a single word.
9    Treat the image as a single word in a circle.
10    Treat the image as a single character.
11    Sparse text. Find as much text as possible in no particular order.
12    Sparse text with OSD.
13    Raw line. Treat the image as a single text line, bypassing hacks that are Tesseract-specific.

函數(shù)說明

PSD分析函數(shù)

def image_to_data(
    image,
    lang=None,
    config='',
    nice=0,
    output_type=Output.STRING,
    timeout=0,
    pandas_config=None,
)

3.5以上版本支持，分析返回文檔結(jié)構(gòu)，完成PSD分析與輸出。

文檔角度與語言檢測

def image_to_osd(
    image,
    lang='osd',
    config='',
    nice=0,
    output_type=Output.STRING,
    timeout=0,
):

OSD檢測，返回文檔的旋轉(zhuǎn)角度與語言檢測信息

代碼演示部分

使用PSD實現(xiàn)文檔結(jié)構(gòu)分析

image?=?cv.imread("D:/images/text_xt.png")
h,?w,?c?=?image.shape

#?文檔結(jié)構(gòu)分析
config?=?('-l?chi_sim?--oem?1?--psm?6')
dict?=?tess.image_to_data(image,?config=config,?output_type=tess.Output.DICT)
print(dict.keys())
print(dict['conf'])
n_boxes?=?len(dict['text'])

繪制所有BOX框

#?全部文檔結(jié)構(gòu)
text_img?=?np.copy(image)
for?i?in?range(n_boxes):
????(x,?y,?w,?h)?=?(dict['left'][i],?dict['top'][i],?dict['width'][i],?dict['height'][i])
????cv.rectangle(text_img,?(x,?y),?(x?+?w,?y?+?h),?(0,?255,?0),?2)
cv.imwrite('D:/layout-text1.png',?text_img)

顯示如下：

使用conf屬性過濾小于0的BOX框

#?根據(jù)conf>0過濾之后
for?i?in?range(n_boxes):
????if?int(dict['conf'][i])?>?0:
????????(x,?y,?w,?h)?=?(dict['left'][i],?dict['top'][i],?dict['width'][i],?dict['height'][i])
????????cv.rectangle(image,?(x,?y),?(x?+?w,?y?+?h),?(0,?255,?0),?2)
cv.imwrite('D:/layout-text2.png',?image)

OSD檢測文檔偏斜與語言類別

#?檢測傾斜角度
image?=?cv.imread("D:/images/text_90.png")
cv.imshow("text_90",?image)
osd?=?tess.image_to_osd(image)
print(osd)
osd_array?=?osd.split("
")
angle?=?int(osd_array[2].split(":")[1])
conf?=?float(osd_array[3].split(":")[1])
print("angle:?",?angle)
print("conf:?",?conf)
dst?=?cv.rotate(image,?cv.ROTATE_90_CLOCKWISE)
cv.imshow("text_90_rotate",?dst)
cv.imwrite('D:/layout-text3.png',?dst)

檢測配置與白名單機制過濾

#?只檢測數(shù)字
custom_config?=?r'--oem?1?--psm?6?outputbase?digits'
ocr_result?=?tess.image_to_string(dst,?config=custom_config)
print(ocr_result)

#?采用白名單方式只檢測數(shù)字
custom_config?=?r'-c?tessedit_char_whitelist=0123456789?--psm?6'
ocr_result?=?tess.image_to_string(dst,?config=custom_config)
print("白名單方式數(shù)字檢測
",ocr_result)

#?檢測中文
ocr_result?=?tess.image_to_string(dst,?lang="chi_sim")
print("
中文檢測與輸出:
",?ocr_result.replace("f",?"").split("
"))

#?檢測中文情況下，只輸出數(shù)字
ocr_result?=?tess.image_to_string(dst,?lang="chi_sim",?config=custom_config)
print("
中文檢測+數(shù)字輸出:
",ocr_result.replace("f",?"").split("
"))

cv.waitKey(0)
cv.destroyAllWindows()

運行結(jié)果：

最后一個，可以看出把O檢測成0了，其它OK！這個是OCR的死穴，永遠(yuǎn)分不清0跟O。最后還有一句話，Tesseract-OCR如果輸入是二值圖像，背景永遠(yuǎn)是白色才是正確之選！

編輯：黃飛

閱讀全文

二值圖像(8682) 二值圖像(8682)
結(jié)構(gòu)化(10262) 結(jié)構(gòu)化(10262)
OCR(16103) OCR(16103)

匯編語言的結(jié)構(gòu)化設(shè)計及其在俄羅斯方塊中的應(yīng)用

為了簡化匯編語言的編寫過程，本文提出了一種結(jié)構(gòu)化的匯編編程思路，并以基于AT89C51芯片（以下對匯編語言的討論針對51單片機系統(tǒng)）的俄羅斯方塊游戲為例，來展現(xiàn)在51單片機中匯編語言結(jié)構(gòu)化編寫的優(yōu)勢。##俄羅斯方塊的軟件實現(xiàn)方法##實驗測試與結(jié)果

2014-06-23 10:27:47

2713

Tesseract的進階用法和最佳實踐

于各個領(lǐng)域，如圖像處理、自動化識別、人工智能等。 Tesseract 是一款開源的 OCR 引擎，最初由 HP 實驗室開發(fā)，后被 Google 收購并開源。Tesseract 以其高精度和高速度而聞名，支持

2023-09-20 11:00:08

518

***結(jié)構(gòu)化消息是什么？

大家好，我已閱讀任何與TrustZone相關(guān)的內(nèi)容，但我無法弄清楚這兩個世界是如何相互溝通的。我所能找到的只是TrustZone API規(guī)范中的內(nèi)容：客戶端和服務(wù)可以通過兩種機制進行通信：結(jié)構(gòu)化

2019-03-20 08:58:16

OCR SDK開發(fā)者平臺推薦：OCR圖像智能字符識別技術(shù)

為了促進業(yè)內(nèi)生態(tài)環(huán)境良好發(fā)展，幫助開發(fā)者更好的專注于自己的產(chǎn)品。想讓產(chǎn)品實現(xiàn)OCR圖像智能字符識別技術(shù)，看此帖!樓主吐血為大家找到一個集身份證識別，駕駛證識別，行駛證識別，銀行卡識別，文檔識別

2015-09-25 13:48:03

OCR微信公眾號實現(xiàn)一號識別

微信公眾賬號試水商業(yè)化的消息近日引爆自媒體圈。廈門云脈公司把多年對OCR各種產(chǎn)品的研究成果集成于云脈OCR微信公眾號中。云脈OCR公眾號是首個OCR技術(shù)識別類微信公眾服務(wù)號，集成了名片、文檔

2014-09-09 18:11:32

結(jié)構(gòu)化布線系統(tǒng)有哪些難題

具有不同的形式，其中一些也被定義為結(jié)構(gòu)化布線的范疇，但它們不能被稱為集成的結(jié)構(gòu)化布線。在臨時的布線系統(tǒng)中可以使用不同類型的布線部件來實現(xiàn)系統(tǒng)的功能，但可能需要更高的成本，并可能經(jīng)常導(dǎo)致通信故障的發(fā)生

2016-05-19 13:46:23

結(jié)構(gòu)化布線系統(tǒng)浸水難題解決方案

　　一年中又到夏季。這意味著降雨、雷暴、臺風(fēng)和洪水即將來臨！在這多雨季節(jié)里，常有人向和聯(lián)電子官網(wǎng)咨詢，結(jié)構(gòu)化布線系統(tǒng)是最容易受到水的影響而遭受損害的部分。本文著眼于浸水對數(shù)據(jù)線纜的影響和水災(zāi)中線

2016-05-15 10:55:10

結(jié)構(gòu)化匯編語言的監(jiān)控程序設(shè)計

技術(shù)指標(biāo),微型計算機技術(shù)答案第5章常用應(yīng)用程序設(shè)計本章以51單片機為基礎(chǔ)，主要介紹結(jié)構(gòu)化匯編語言的監(jiān)控程序設(shè)計思想和實時測控系統(tǒng)中最常用的數(shù)字濾波技術(shù)、標(biāo)度變換、插值算法以及報警程序設(shè)計等。程序與程序設(shè)計...

2021-09-01 06:27:34

結(jié)構(gòu)化匯編語言的監(jiān)控程序設(shè)計思想

微型計算機控制技術(shù)_第五章第5章常用應(yīng)用程序設(shè)計本章以51單片機為基礎(chǔ)，主要介紹結(jié)構(gòu)化匯編語言的監(jiān)控程序設(shè)計思想和實時測控系統(tǒng)中最常用的數(shù)字濾波技術(shù)、標(biāo)度變換、插值算法以及報警程序設(shè)計等。程序

2021-09-10 06:50:34

結(jié)構(gòu)化程序設(shè)計和面向?qū)ο蟪绦蛟O(shè)計

結(jié)構(gòu)化程序設(shè)計和面向?qū)ο蟪绦蛟O(shè)計，在接下來很長的一段時間里，我將陸續(xù)分享項目實戰(zhàn)經(jīng)驗。從電源、單片機、晶體管、驅(qū)動電路、顯示電路、有線通訊、無線通信、傳感器、原理圖設(shè)計、PCB設(shè)計、軟件設(shè)計、上位機等，給新手綜合學(xué)習(xí)的平臺，給老司機交流的平臺。所有文章來源于項目實戰(zhàn)，屬于原創(chuàng)。

2021-07-14 06:35:13

結(jié)構(gòu)化設(shè)計分為哪幾部分？結(jié)構(gòu)化設(shè)計的要求有哪些

結(jié)構(gòu)化設(shè)計分為哪幾部分？結(jié)構(gòu)化設(shè)計的要求有哪些？結(jié)構(gòu)化設(shè)計主要包括哪些部分？

2021-12-23 06:15:51

CODESYS結(jié)構(gòu)化文本簡介與基本概念

化等操作實現(xiàn)工程。因此，可以在同一個設(shè)備上運行多個應(yīng)用，也可以對應(yīng)用進行拷貝，或者可以在一個工程中混合配置

2021-07-02 06:54:58

Codesys之結(jié)構(gòu)化文本概述相關(guān)資料分享

一張簡單的方法，系統(tǒng)的編輯器和調(diào)試器的功能是建立在高級編程語言的基礎(chǔ)上（如Visual C++）具體來說CoDeSys就是一個編程工具，支持IEC61131-3標(biāo)準(zhǔn)協(xié)議，用于工業(yè)PLC控制。CodeSys有六種編程語言（IL,ST,FBD,LD,CFC,SFC）,而其中ST為結(jié)構(gòu)化文本。...

2021-07-02 07:34:28

Deeplearningai結(jié)構(gòu)化機器學(xué)習(xí)項目

Deeplearningai 結(jié)構(gòu)化機器學(xué)習(xí)項目 Week2 6-10

2020-05-18 15:12:43

KGB知識圖譜基于傳統(tǒng)知識工程的突破分析

格式文件，保留文件中表格與文字格式等重要信息。對于圖片信息，OCR可自動識別并抽取圖片中的文字信息。2. 知識抽?。篕GB知識圖譜引擎，可從結(jié)構(gòu)化表格與非結(jié)構(gòu)化文本中自適應(yīng)識別并抽取關(guān)鍵知識（主體

2019-10-22 15:25:56

Labview調(diào)用OCR Training.exe實現(xiàn)字符識別

加上/fontpath，同理圖像路徑之前要加上/imagespath 來進行命令的格式編輯，下方藍(lán)色框中為已擁有*.abc訓(xùn)練文件的OCR Training.exe應(yīng)用程序調(diào)用格式舉例，橙色框為調(diào)用

2020-08-16 17:36:58

MaxCompute(ODPS)上處理非結(jié)構(gòu)化數(shù)據(jù)的Best Practice

，我們收到用戶許多關(guān)于優(yōu)化和怎樣最好的使用非結(jié)構(gòu)化功能的問題。這里通過分析非結(jié)構(gòu)化框架底層的一些實現(xiàn)原理以及我們看到的一些使用場景，提供一些關(guān)于Best Practice的總結(jié)，方便大家更有效的在

2018-05-15 12:21:06

MaxCompute與OSS非結(jié)構(gòu)化數(shù)據(jù)讀寫互通（及圖像處理實例）

MaxCompute的SQL邏輯運算，這一部分計算是基于MaxCompute內(nèi)置的強大結(jié)構(gòu)化SQL運算引擎，并可能產(chǎn)生新的Record3.運算過后的Record中再傳遞給用戶自定義的Output邏輯，用戶

2018-03-30 11:51:18

MaxCompute讀取分析OSS非結(jié)構(gòu)化數(shù)據(jù)的實踐經(jīng)驗總結(jié)

字節(jié)數(shù)，向前或向后尋找換行符，來保證最終的切分點落在一整條記錄的尾部。具體的實現(xiàn)細(xì)節(jié)相對來講比較復(fù)雜，可以參考在《訪問 OSS 非結(jié)構(gòu)化數(shù)據(jù)》文檔中提到的代碼示例來進行分析。注意點在計算字節(jié)數(shù)的過程中

2018-06-20 15:01:09

NLPIR在文本信息提取方面的優(yōu)勢介紹

可自動識別并抽取圖片中的文字信息。2、對結(jié)構(gòu)化表格數(shù)據(jù)知識抽取KGB能夠自適應(yīng)解讀并抽取結(jié)構(gòu)化表格數(shù)據(jù)，實現(xiàn)知識的快速生成。3、對非結(jié)構(gòu)化文檔知識抽取KGB知識規(guī)則引擎，能夠快速定位非結(jié)構(gòu)化文檔中

2019-09-12 15:33:03

NLPIR大數(shù)據(jù)知識圖譜完美展現(xiàn)文本數(shù)據(jù)內(nèi)容

)是基于自然語言理解、漢語詞法分析，采用KGB語法從結(jié)構(gòu)化數(shù)據(jù)與非結(jié)構(gòu)化文檔中抽取各類知識，大數(shù)據(jù)語義智能分析與知識推理，深度挖掘知識關(guān)聯(lián)，實時高效構(gòu)建知識圖譜。　　KGB知識圖譜引擎功能介紹　　一、文檔

2019-07-01 11:40:17

OpenHarmony集成OCR三方庫實現(xiàn)文字提取

具體的實現(xiàn)；Native層使用了三方庫Tesseract提供具體的實現(xiàn)功能。5. 源碼分析本樣例源碼的分析主要涉及到兩個方面，一方面是N-API接口的實現(xiàn)，另一方面是應(yīng)用層的頁面布局和業(yè)務(wù)邏輯

2022-11-15 12:09:50

Python爬蟲初學(xué)者需要準(zhǔn)備什么？

解析網(wǎng)頁，便于抽取數(shù)據(jù)。2.了解非結(jié)構(gòu)化數(shù)據(jù)的存儲爬蟲抓取的數(shù)據(jù)結(jié)構(gòu)復(fù)雜傳統(tǒng)的結(jié)構(gòu)化數(shù)據(jù)庫可能并不是特別適合我們使用。我們前期推薦使用MongoDB 就可以。3. 掌握一些常用的反爬蟲技巧使用代理IP池

2018-06-20 17:14:15

SDRAM文件結(jié)構(gòu)存儲控制的FPGA實現(xiàn)

幀結(jié)構(gòu)，緩存系統(tǒng)的設(shè)計需要保存原始采樣數(shù)據(jù)并能夠實現(xiàn)數(shù)據(jù)的重組幀，以滿足不同處理需求。針對以上問題，本文提出了一種基于文件結(jié)構(gòu)存儲方式的數(shù)據(jù)緩存系統(tǒng)，該系統(tǒng)利用FPGA設(shè)計結(jié)構(gòu)化狀態(tài)機實現(xiàn)對SDRAM的控制，完成了對數(shù)據(jù)的緩存與重組幀，具有速度快、可靠性高、靈活性強和功能可擴展等優(yōu)點。

2012-08-13 10:40:40

c程序的結(jié)構(gòu)化組織是什么

，提高軟件的穩(wěn)定性。通常情況下,軟件項目采用層次化結(jié)構(gòu)和模塊化開發(fā)的方法,例如,一個嵌入式軟件項目可能有驅(qū)動層,操作系統(tǒng)層,功能層,應(yīng)用程序?qū)?每一個層使用它的下層提供的接口,并為它的上層提供調(diào)用接口

2020-06-16 04:35:07

linux的tesseract-ocr安裝

1. 在ubuntu下可以自動安裝sudo apt-get install tesseract-ocr

2019-07-15 06:40:06

【KV260視覺入門套件試用體驗】七、VITis AI字符和文本檢測（OCR&Textmountain）

視覺領(lǐng)域的重要問題，主要是識別和理解圖像或視頻中的文字信息。字符檢測和識別（OCR）技術(shù)最早在1929年由德國科學(xué)家Tausheck提出，定義為將印刷體的字符從紙質(zhì)文檔中識別出來。隨著OCR技術(shù)的日益

2023-09-26 16:31:59

一種結(jié)構(gòu)化道路環(huán)境中的視覺導(dǎo)航系統(tǒng)詳解

根據(jù)結(jié)構(gòu)化道路環(huán)境的特點提出了一種將邊沿檢測和道路環(huán)境知識相結(jié)合的機器視覺算法 , 并結(jié)合基于行為響應(yīng)的路徑規(guī)劃方法和智能預(yù)瞄控制方法 , 實現(xiàn)了一套基本的機器人視覺導(dǎo)航系統(tǒng) . 在自主機器人實驗

2023-09-25 07:23:39

基于結(jié)構(gòu)化平均感知機的分詞器Java實現(xiàn)

1.6以上版本開源，文檔位于項目wiki中，歡迎使用！【hanlp1.7新版本已經(jīng)發(fā)布，可以去新版本查到看使用】結(jié)構(gòu)化預(yù)測關(guān)于結(jié)構(gòu)化預(yù)測和非結(jié)構(gòu)化預(yù)測的區(qū)別一張講義說明如下：更多知識請參考Neubig

2019-01-14 11:15:41

基于Feder的IVF_FLAT可視化設(shè)計實現(xiàn)

1、向量數(shù)據(jù)庫是如何檢索的？　　Embedding是分析非結(jié)構(gòu)化數(shù)據(jù)的重要方式，當(dāng)我們將圖片、聲音編碼為向量后，這些數(shù)據(jù)依舊能夠保留原始數(shù)據(jù)（圖片、聲音等）的詳細(xì)信息。然而，我們很難直接對這些編碼后

2022-10-12 14:25:43

如何使用arm匯編指令去實現(xiàn)一種結(jié)構(gòu)化編程呢？

如何使用arm匯編指令去實現(xiàn)一種結(jié)構(gòu)化編程呢？有哪位大神可以解答一下嗎

2022-11-09 15:18:11

對與性能比較低的51單片機，結(jié)構(gòu)化編程性能提升多少？

對與性能比較低的51單片機，結(jié)構(gòu)化編程性能提升多少

2023-10-26 06:21:44

怎么實現(xiàn)基于結(jié)構(gòu)化方法的無線傳感器網(wǎng)絡(luò)設(shè)計？

怎么實現(xiàn)基于結(jié)構(gòu)化方法的無線傳感器網(wǎng)絡(luò)設(shè)計？

2021-05-31 06:34:16

教你如何走捷徑，OCR SDK開發(fā)者平臺開放API接口

、文檔、名片等，所有的這些識別功能為社會多個行業(yè)進行無紙化辦公、移動辦公等新的辦公模式提供了可能、提高了效率。上述所提到的所有的OCR技術(shù)，OCR SDK開發(fā)者平臺都能為大家提供成熟的OCR SDK接入

2015-09-22 17:21:16

用C語言的結(jié)構(gòu)體實現(xiàn)字節(jié)、位操作

用C語言的結(jié)構(gòu)體實現(xiàn)字節(jié)、位操作結(jié)構(gòu)化程序設(shè)計是編寫清晰、正確和易于修改的程序。而對于大多數(shù)編程人員來說，結(jié)構(gòu)化程序設(shè)計是十分重要的，當(dāng)然結(jié)構(gòu)化程序設(shè)計的清晰、正確和易于維護也是每一個編程人員所希望

2009-09-21 09:25:25

白光LED結(jié)構(gòu)化涂層制備及其應(yīng)用研究

不同工藝參數(shù)研究其對聚合物最終成形形貌的影響，實現(xiàn)對成形結(jié)構(gòu)的有效調(diào)節(jié)。在結(jié)構(gòu)電極誘導(dǎo)中探究結(jié)構(gòu)化電場中聚合物的成形規(guī)律及電極電壓、聚合物初始膜厚、電極間距等工藝參數(shù)對成形結(jié)構(gòu)形貌輪廓的影響規(guī)律

2022-03-29 15:44:41

研發(fā)干貨丨基于OK3399-C平臺android系統(tǒng)下實現(xiàn)圖像識別

/rk3399/RK3399_SSD_Android&Linux_V1.0_20180522.pdfhttps://github.com/tesseract-ocr/tesseract.githttps://github.com/tensorflow/tensorflow.git

2021-02-07 08:46:10

請問如何借助SC Express減少結(jié)構(gòu)化測試次數(shù)？

如何借助SC Express減少結(jié)構(gòu)化測試次數(shù)？

2021-05-11 06:46:56

阿里OCR接口記錄

OCR調(diào)用文檔中需要傳入BASE64,感謝Apache

2019-08-08 07:48:51

首發(fā) | 告別手動錄入，開放平臺OCR上線印刷文字識別！

位置。而將這些文本錄入也一直耗費著大量的時間和人力。如何高效處理海量非結(jié)構(gòu)化數(shù)據(jù)，使它們能快速轉(zhuǎn)化為計算機可處理的數(shù)據(jù)，方便進一步數(shù)據(jù)庫采集、管理、分析和決策，已成為下階段的行業(yè)大方向。作為處理圖片文字

2018-05-17 15:18:23

結(jié)構(gòu)化綜合布線技術(shù)

結(jié)構(gòu)化綜合布線實質(zhì)就是指建筑物或建筑群內(nèi)所安裝的傳輸線路.

2010-06-09 14:33:05

什么是OCR

什么是OCR OCR的英文全稱： OCR是英文Optical Character Recognition的縮寫，意思是光學(xué)字符識別，也可簡單地稱為文字識別，是文字自動輸入的一種方法。它通過掃描和攝像

2009-04-10 12:55:05

5458

ISSP結(jié)構(gòu)化ASIC解決方案

ISSP結(jié)構(gòu)化ASIC解決方案 結(jié)構(gòu)化專用集成電路(structured ASIC)對設(shè)計工程師而言還是一個新名詞，然而目前已經(jīng)有多家公司正計劃涉足這一領(lǐng)域?？焖俟?/div>

2009-12-27 13:32:40

1174

結(jié)構(gòu)化布線的綜合說明

結(jié)構(gòu)化布線的綜合說明一、結(jié)構(gòu)化布線系統(tǒng)簡介隨著計算機和通信技術(shù)的飛速發(fā)展,網(wǎng)絡(luò)應(yīng)用

2010-04-14 17:16:05

605

結(jié)構(gòu)化綜合布線系統(tǒng)的問題分析

,智能大樓的出現(xiàn)為傳統(tǒng)的建筑注入了全新的概念,并成為現(xiàn)代建筑發(fā)展的方向,而結(jié)構(gòu)化的布線">綜合布線系統(tǒng)是實現(xiàn)大樓智能化的基礎(chǔ)和先決條件。

2011-02-22 10:46:51

1804

工業(yè)洗滌設(shè)備結(jié)構(gòu)化編程方式

本內(nèi)容介紹了工業(yè)洗滌設(shè)備結(jié)構(gòu)化編程方式

2011-06-16 15:54:51

探究最佳的結(jié)構(gòu)化ASIC設(shè)計方法

由于與深亞微米標(biāo)準(zhǔn)單元ASIC相關(guān)的非重復(fù)性工程費用（NRE）越來越大，設(shè)計周期又很長，因此利用結(jié)構(gòu)化ASIC進行定制IC設(shè)計的吸引力正變得越來越大。結(jié)構(gòu)化ASIC能以極具競爭力的單位成

2012-05-02 10:39:19

1655

輸液袋噴碼OCR字符檢測# 機器視覺# OCR識別# 自動化檢測# 噴碼字符檢測

OCR

fuweizn發(fā)布于 2023-04-17 15:53:01

基于zed的tesseract移植過程記錄

于是今天就打算把這個軟件移植到Zynq上，在PC上之前就已經(jīng)成功安裝了tesseract了，并且利用自帶的測試圖片試了下，沒問題。

2017-02-10 18:50:31

1427

利用狀態(tài)機的狀態(tài)機實現(xiàn)層次結(jié)構(gòu)化設(shè)計

練習(xí)九.利用狀態(tài)機的嵌套實現(xiàn)層次結(jié)構(gòu)化設(shè)計目的：１.運用主狀態(tài)機與子狀態(tài)機產(chǎn)生層次化的邏輯設(shè)計；

2017-02-11 05:52:50

3126

非結(jié)構(gòu)化P2P資源搜索策略研究_楊正華

非結(jié)構(gòu)化P2P資源搜索策略研究_楊正華

2017-03-19 11:30:43

pytesseract簡要解析

、Image、tesseract-ocr，然后： pip install pytesseract pytesseract在官網(wǎng)上說了自己是個wrapper，真正干活的是tesseract-ocr

2017-10-11 14:14:23

軟件工程中結(jié)構(gòu)化設(shè)計方法探究

設(shè)計、程序設(shè)計之前，必須先確定軟件總體結(jié)構(gòu)。軟件總體結(jié)構(gòu)設(shè)計的方法主要有結(jié)構(gòu)化設(shè)計、面向數(shù)據(jù)結(jié)構(gòu)的設(shè)計和面向?qū)ο蟮脑O(shè)計，其中結(jié)構(gòu)化設(shè)計方法是應(yīng)用最廣泛的一種，它是建立良好程序結(jié)構(gòu)的方法，提出了衡量模塊質(zhì)量的標(biāo)準(zhǔn)是高

2017-10-19 14:38:54

MCS-51系列單片機結(jié)構(gòu)化程序設(shè)計實現(xiàn)方法

中，實現(xiàn)隔離的方法是將處理特定任務(wù)的指令和數(shù)據(jù)設(shè)計成子程序或中斷服務(wù)子程序。這些子程序或中斷服務(wù)子程序稱作功能模塊，其具有確定功能，處理特定任務(wù)，解決專門問題。在MCS-51系列單片機結(jié)構(gòu)化程序設(shè)計時，按照總體規(guī)劃和總體設(shè)計，由若干軟件設(shè)

2017-10-30 10:10:28

改進區(qū)域生長的非結(jié)構(gòu)化道路識別

針對智能車輛在非結(jié)構(gòu)化道路識別中需要采用眾多的特征參數(shù)，增加了特征融合識別難度與計算復(fù)雜度，并且部分背景與道路區(qū)域存在相似性會產(chǎn)生道路識別的誤分、誤判的問題，提出了一種基于主成分分析的支持向量

2017-12-01 14:59:18

中文商品屬性結(jié)構(gòu)化方法

從非結(jié)構(gòu)化商品描述文本中抽取結(jié)構(gòu)化屬性信息，對于電子商務(wù)實現(xiàn)商品的對比與推薦及用戶需求預(yù)測等功能具有重要意義．現(xiàn)有結(jié)構(gòu)化方法大多采用監(jiān)督或半監(jiān)督的分類方法抽取屬性值與屬性名，通過文法分析器分析

2018-01-02 15:58:42

什么叫結(jié)構(gòu)化的算法_算法和結(jié)構(gòu)化數(shù)據(jù)初識

結(jié)構(gòu)化算法是由一些基本結(jié)構(gòu)順序組成的，就是把一個大的功能的實現(xiàn)分隔為許多個小功能的實現(xiàn)。在基本結(jié)構(gòu)之間不存在向前或向后的跳轉(zhuǎn)，流程的轉(zhuǎn)移只存在于一個基本的結(jié)構(gòu)范圍內(nèi)。一個非結(jié)構(gòu)化的算法可以用一個等價的結(jié)構(gòu)化算法代替，其功能不變。這樣的好處是可以將復(fù)雜問題簡單化，讓編程更容易，提高代碼維護和可讀性。

2018-01-03 16:09:37

11532

三菱Q系列PLC編程手冊（結(jié)構(gòu)化文本篇）

Q系列PLC編程手冊（結(jié)構(gòu)化文本篇）

2018-03-07 18:00:00

東方網(wǎng)力“天眼”結(jié)構(gòu)化一體機實現(xiàn)實時視頻流結(jié)構(gòu)化分析

東方網(wǎng)力“天眼”結(jié)構(gòu)化一體機可以實現(xiàn)實時視頻流結(jié)構(gòu)化分析，并基于結(jié)構(gòu)化分析結(jié)果進行告警、檢索和挖掘等功能，還可以針對離線視頻文件上傳并結(jié)構(gòu)化分析，基于分析結(jié)果進行大數(shù)據(jù)分析、檢索等。所以，該一體機也可單機部署應(yīng)用。單機應(yīng)用模式架構(gòu)涉及的設(shè)備主要包括結(jié)構(gòu)化一體機、IPC或NVR等。

2018-08-14 17:34:33

5096

什么是視頻結(jié)構(gòu)化，又能做些什么？

　利用CPU+GPU協(xié)同計算能力實現(xiàn)資源動態(tài)調(diào)配，采用先進的智能分析技術(shù)，自動提取實時或離線的視頻圖像中的車輛、行人、非機動車細(xì)節(jié)特征信息，對目標(biāo)類型、顏色等屬性特征進行結(jié)構(gòu)化，為事前、事中、事后的事件布防、綜合布控、研判分析提供數(shù)據(jù)基礎(chǔ)，保證信息查找檢索的高效性，提高公安視頻的應(yīng)用效率。

2018-09-04 10:44:00

10387

結(jié)構(gòu)化布線系統(tǒng)的四點注意事項

布線系統(tǒng)結(jié)構(gòu)化 結(jié)構(gòu)化布線 title=結(jié)構(gòu)化布線結(jié)構(gòu)化布線 title=結(jié)構(gòu)化布線結(jié)構(gòu)化布線系統(tǒng)網(wǎng)絡(luò)有至少15年的使用壽命，因此網(wǎng)絡(luò)的運營成本和升級成本將等于或超過最初的投資金額。

2018-10-16 10:52:00

1093

如何使用西門子結(jié)構(gòu)化文本編程

下面，我就結(jié)合自己的一些使用經(jīng)驗介紹一下如何使用結(jié)構(gòu)化文本編程。

2019-08-04 08:29:00

9314

視頻結(jié)構(gòu)化技術(shù)在智慧交通領(lǐng)域有什么可以應(yīng)用的

視頻結(jié)構(gòu)化描述既是海量視頻實現(xiàn)信息化、情報化轉(zhuǎn)化行之有效的技術(shù)，也是當(dāng)前公共安全領(lǐng)域中對視頻結(jié)構(gòu)化處理的一個指向性方案。

2019-10-28 16:07:54

961

海量非結(jié)構(gòu)化數(shù)據(jù)存儲難題，杉巖數(shù)據(jù)對象存儲完美解決

過去幾年，大數(shù)據(jù)產(chǎn)業(yè)更多關(guān)注的是如何處理海量、多源和異構(gòu)的數(shù)據(jù)，但我們必須承認(rèn)這些只是冰山一角。目前，結(jié)構(gòu)化數(shù)據(jù)僅占到全部數(shù)據(jù)量的20%，其余80%都是以文件形式存在的非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù)。伴隨

2020-03-15 17:22:00

1025

安防監(jiān)控視頻結(jié)構(gòu)化那些事兒

即便不考慮各個監(jiān)控系統(tǒng)之間的信息關(guān)聯(lián)，光瀏覽這些視頻就需要花費大量的人力物力。解決這一問題的核心技術(shù)即視頻結(jié)構(gòu)化描述技術(shù)，將海量視頻或圖片的非結(jié)構(gòu)化數(shù)據(jù)提取并轉(zhuǎn)化為結(jié)構(gòu)化信息描述。

2020-03-20 10:20:50

2986

西門子PLC教程之結(jié)構(gòu)化編程的詳細(xì)資料說明

本文檔的主要內(nèi)容詳細(xì)介紹的是西門子PLC教程之結(jié)構(gòu)化編程的詳細(xì)資料說明。

2020-03-25 16:39:00

視頻結(jié)構(gòu)化怎樣實現(xiàn)突破

視頻結(jié)構(gòu)化技術(shù)是一種把視頻畫面聲音、轉(zhuǎn)化為人和機器可以理解的信息的技術(shù)，目前主要應(yīng)用于安防、交通領(lǐng)域，可以檢測車流、人流，甚至鎖定某個人，某輛車。

2020-04-03 10:39:11

790

結(jié)構(gòu)化道路環(huán)境中的視覺導(dǎo)航系統(tǒng)的設(shè)計與實現(xiàn)

根據(jù)結(jié)構(gòu)化道路環(huán)境的特點提出了一種將邊沿檢測和道路環(huán)境知識相結(jié)合的機器視覺算法并結(jié)合基于行為響應(yīng)的路徑規(guī)劃方法和智能預(yù)瞄控制方法實現(xiàn)了一套基本的機器人視覺導(dǎo)航系統(tǒng)。在自主機器人實驗平臺ATRV2上的實驗結(jié)果表明，該視覺導(dǎo)航系統(tǒng)能夠?qū)崟r理解結(jié)構(gòu)化道路環(huán)境，并且能夠控制機器人沿著合理路徑行駛。

2020-07-06 14:54:58

使用貝葉斯決策和Hough實現(xiàn)非結(jié)構(gòu)化道路檢測與障礙物識別算法

為了實現(xiàn)非結(jié)構(gòu)化道路檢測與障礙物的識別，提出了一種基于最小錯誤率貝葉斯決策與 Hough變換相結(jié)合的非結(jié)構(gòu)化道路檢測與障礙物識別算法。算法首先將Otsu多閾值理論引入到最小錯誤率貝葉斯決策中并進

2020-07-06 17:45:58

使用數(shù)字識別和AI實現(xiàn)OCR的資料合集

本文檔的主要內(nèi)容詳細(xì)介紹的是使用數(shù)字識別和AI實現(xiàn)OCR的資料合集。

2020-07-17 08:00:00

怎么樣使用機器視覺技術(shù)和支持向量機實現(xiàn)非結(jié)構(gòu)化道路的檢測

機器視覺檢測非結(jié)構(gòu)化道路邊緣的難點在于路面像素與非路面像素特征差異復(fù)雜。使用支持向量機分類算法實現(xiàn)了非結(jié)構(gòu)化道路的邊緣檢測。算法引入感興趣區(qū)域來消除環(huán)境噪聲，并通過交叉驗證方法優(yōu)化了算法參數(shù)。最后在支持向量機的分類結(jié)果上使用霍夫變換提取道路邊緣。 Matlab實驗證明算法具有很好的準(zhǔn)確性和魯棒性。

2020-08-27 14:30:00

FPGA模塊化設(shè)計與AlteraHardCopy結(jié)構(gòu)化ASIC

本文檔的主要內(nèi)容詳細(xì)介紹的是FPGA模塊化設(shè)計與AlteraHardCopy結(jié)構(gòu)化ASIC。

2021-01-20 17:03:51

匯編語言結(jié)構(gòu)化設(shè)計程序教程

匯編語言結(jié)構(gòu)化設(shè)計程序教程說明。

2021-03-26 09:38:56

如何使用FPGA實現(xiàn)結(jié)構(gòu)化LDPC碼的高速編譯碼器

結(jié)構(gòu)化LDPC碼可進行相應(yīng)擴展通過對編譯碼算法，優(yōu)化編譯碼結(jié)構(gòu)進行調(diào)整，降低了編譯碼囂硬件實現(xiàn)中的關(guān)鍵路徑遲延，并采用Xilinx公司的Virtex一4 VLX80 FPGA芯片實現(xiàn)了一個碼長10 240，碼率1／2的非正則結(jié)構(gòu)化LDPC碼編碼器和譯碼器。實現(xiàn)結(jié)果表明：該編碼器信息吞吐量為1．878 Gb／

2021-03-26 15:58:00

融合結(jié)構(gòu)化信息的中文指代消解模型

在LEE等人提出的端到端指代消解模型基礎(chǔ)上，考慮中文行文特點，提出一種融合結(jié)構(gòu)化信息的中文指代消解模型。壓縮文檔中所進行有句子對應(yīng)的成分句法樹并獲取文檔壓縮樹葉節(jié)點深度，采用成分句法樹的結(jié)構(gòu)化嵌入

2021-05-12 10:53:43

如何在Pixie中收集大量非結(jié)構(gòu)化數(shù)據(jù)

Pixie 旨在幫助開發(fā)者快速了解并調(diào)試產(chǎn)品系統(tǒng)。為了實現(xiàn)這一目標(biāo)，我們將提供支持，幫助開發(fā)者輕松訪問其生產(chǎn)系統(tǒng)中的一系列指標(biāo)和日志數(shù)據(jù)。如，幫助收集系統(tǒng)中各個進程的 CPU 和內(nèi)存用量的結(jié)構(gòu)化數(shù)據(jù)

2021-08-10 17:37:31

2396

如何用Java幾行代碼從圖片提取文字

tesseract+spring web的技術(shù)解決方案，并簡作論述，與君共勉。一、tesseract-ocr介紹 ocr含義是Optical Character Recognition，含義即視覺字符識別

2021-10-28 14:05:34

1723

C語言程序設(shè)計第四講結(jié)構(gòu)化程序設(shè)計之選擇

C語言程序設(shè)計第四講結(jié)構(gòu)化程序設(shè)計之選擇

2021-12-22 10:34:31

用于openharmony的輕量級、簡單的結(jié)構(gòu)化NoSQL數(shù)據(jù)庫

用于openharmony的輕量級、簡單的結(jié)構(gòu)化 NoSQL 數(shù)據(jù)庫。下載依賴項{ 實現(xiàn)“io.openharmony.tpc.thirdlib:ohos-NoSql:1.0.0” } 將數(shù)據(jù)

2022-04-13 10:05:03

FXCPU結(jié)構(gòu)化編程手冊之應(yīng)用函數(shù)篇

FXCPU 結(jié)構(gòu)化編程手冊 [應(yīng)用函數(shù)篇] 產(chǎn)品規(guī)格書

2022-08-24 15:17:11

FXCPU結(jié)構(gòu)化編程手冊[順控指令篇]

FXCPU 結(jié)構(gòu)化編程手冊 [順控指令篇] 產(chǎn)品規(guī)格書

2022-08-24 15:16:17

MELSEC Q/L結(jié)構(gòu)體編程手冊(結(jié)構(gòu)化文本篇)

MELSEC-Q/L結(jié)構(gòu)體編程手冊(結(jié)構(gòu)化文本篇) 產(chǎn)品規(guī)格書

2022-08-25 14:33:52

MELSEC iQ R結(jié)構(gòu)化文本(ST)編程指南

MELSEC iQ-R 結(jié)構(gòu)化文本(ST)編程指南產(chǎn)品規(guī)格書.本手冊用于幫助理解如何使用GX Work3進行結(jié)構(gòu)化文本編程等內(nèi)容

2022-08-26 16:08:39

OpenHarmony集成OCR三方庫實現(xiàn)文字提取

觀點 1.?簡介 Tesseract(Apache 2.0 License)是一個可以進行圖像OCR識別的C++庫，可以跨平臺運行。本樣例基于Tesseract庫進行適配，使其可以運行

2022-11-14 21:25:21

888

KUKA機器人結(jié)構(gòu)化機器人程序分析

KRL 是一種類似PASCAL的高級編程語言,利用KRL語言編程能夠實現(xiàn)結(jié)構(gòu)化編程處理復(fù)雜的任務(wù)。

2023-02-02 09:36:50

1631

為什么數(shù)據(jù)中心要采用結(jié)構(gòu)化布線？

在本文中，將解釋什么是結(jié)構(gòu)化布線系統(tǒng)，并分析在數(shù)據(jù)中心實施它們可以獲得的好處。

2023-02-13 15:17:04

438

OCR實戰(zhàn)教程

OCR 是光學(xué)字符識別（英語：Optical Character Recognition，OCR）是指對文本資料的圖像文件進行分析識別處理，獲取文字及版面信息的過程。

2023-02-24 10:36:16

677

KUKA 機器人的結(jié)構(gòu)化機器人程序介紹

KRL 是一種類似PASCAL的高級編程語言,利用KRL語言編程能夠實現(xiàn)結(jié)構(gòu)化編程處理復(fù)雜的任務(wù)。

2023-03-08 10:13:30

1823

記錄關(guān)系數(shù)據(jù)庫中的半結(jié)構(gòu)化數(shù)據(jù)

NoSQL革命已經(jīng)進入了關(guān)系世界。您可能正在使用關(guān)系數(shù)據(jù)庫，但仍必須查詢和理解隱藏在文本列、JSON或 XML文檔中的半結(jié)構(gòu)化數(shù)據(jù)。

2023-03-15 17:42:44

680

KUKA機器人-結(jié)構(gòu)化機器人程序V5.9

機器人程序的結(jié)構(gòu)是體現(xiàn)其使用價值的一個十分重要的因數(shù)。程序結(jié)構(gòu)化越規(guī)范，程序就越易于理解、執(zhí)行效果越好、越便于讀取、越經(jīng)濟。為了使程序得到結(jié)構(gòu)化設(shè)計，可以使用以下技巧

2023-05-10 11:45:47

669

Python Pandas如何來管理結(jié)構(gòu)化數(shù)據(jù)

Python Pandas是一個為Python編程提供數(shù)據(jù)操作和分析功能的開源工具包。這個庫已經(jīng)成為數(shù)據(jù)科學(xué)家和分析師的必備工具。它提供了一種有效的方法來管理結(jié)構(gòu)化數(shù)據(jù)(Series

2023-05-25 11:22:07

421

OCR如何自動識別圖片文字

OCR 是光學(xué)字符識別（英語：Optical Character Recognition，OCR）是指對文本資料的圖像文件進行分析識別處理，獲取文字及版面信息的過程。很早之前就有同學(xué)在公眾號后臺

2023-10-31 16:45:39

358

使用關(guān)系數(shù)據(jù)庫中的半結(jié)構(gòu)化數(shù)據(jù)

2023-12-20 10:46:04

237

CFD 設(shè)計利器：結(jié)構(gòu)化和非結(jié)構(gòu)化網(wǎng)格的組合使用

在CFD的發(fā)展歷史中，結(jié)構(gòu)化網(wǎng)格出現(xiàn)最早，至今仍在使用。結(jié)構(gòu)化網(wǎng)格有幾個主要優(yōu)點，如精度高、生成速度快、單元分布均勻。有些工具擅長繪制這類網(wǎng)格，例如CadenceFidelityAutomesh

2023-12-23 08:12:37

292

已全部加載完成

搜索歷史

Tesseract-OCR中如何實現(xiàn)結(jié)構(gòu)化的文檔分析

評論