PowerToys와 내부 기능으로 OCR 을 활용한 텍스트 추출 기능

 

 

해당 기능에 대해서 마이크로소프트에서 제공하는 참고글

 

https://learn.microsoft.com/ko-kr/windows/powertoys/text-extractor#supported-languages

 

PowerToysText ExtractorWindows용 유틸리티

Text Extractor 는 화면의 어디에서나 텍스트를 복사하는 편리한 방법입니다.

learn.microsoft.com

 

 

Text Extractor 유틸리티
아티클
2023. 10. 30.
기여자 7명
이 문서의 내용
활성화하는 방법
비활성화하는 방법
캡처를 시도하는 동안 조정
설정
2개 더 표시
Text Extractor 를 사용하면 이미지 또는 비디오 내부를 포함하여 화면의 어디에서나 텍스트를 복사할 수 있습니다. 이 코드는 Joe Finney의 텍스트 잡기를 기반으로 합니다.

활성화하는 방법
활성화 바로 가기(기본값: ⊞ Win+Shift+T)를 사용하면 화면에 오버레이가 표시됩니다. 기본 마우스 단추를 클릭하고 누른 상태로 끌어서 캡처를 활성화합니다. 텍스트가 클립보드에 저장됩니다.

비활성화하는 방법
선택한 영역의 텍스트가 인식되고 클립보드에 복사된 직후 캡처 모드가 비활성화됩니다. 언제든지 Esc키를 눌러캡처 모드를 종료할 수 있습니다.

캡처를 시도하는 동안 조정
Shift 키를 누른상태에서캡처 영역의 크기를 조정하는 것에서 캡처 영역 이동으로 변경합니다. Shift를 릴리스하면 크기를 다시 조정할 수 있습니다.

 중요

생성된 텍스트가 완벽하지 않을 수 있으므로 출력에 대한 빠른 증명 읽기를 수행해야 합니다.
이 도구는 OCR(광학 문자 인식)을 사용하여 화면에서 텍스트를 읽습니다.
사용되는 기본 언어는 시스템 언어 > 키보드 설정을 기반으로 합니다Windows(OCR 언어 팩을 설치할 수 있음).
설정
설정 메뉴에서 다음 옵션을 구성할 수 있습니다.

설정 설명
활성화 바로 가기 이 모듈을 켜거나 끄는 사용자 지정 가능한 키보드 명령입니다.
기본 언어 OCR에 사용되는 언어입니다.
지원되는 언어
Text Extractor 는 OCR 언어 팩이 설치된 언어만 인식할 수 있습니다.

다음 명령을 실행하여 PowerShell을 통해 목록을 가져올 수 있습니다.

PowerShell

복사
# Please use Windows PowerShell, not PowerShell 7 as these aren't .NET Core libraries

[Windows.Media.Ocr.OcrEngine, Windows.Foundation, ContentType = WindowsRuntime]

[Windows.Media.Ocr.OcrEngine]::AvailableRecognizerLanguages
OCR 언어 팩을 쿼리하는 방법
지원되는 모든 언어 팩 목록을 반환하려면 PowerShell을 관리사용자로 열고(마우스 오른쪽 단추를 클릭한 다음, "관리이스트레이터로 실행")을 선택하고 다음 명령을 입력합니다.

PowerShell

복사
Get-WindowsCapability -Online | Where-Object { $_.Name -Like 'Language.OCR*' }
출력 예제:

PowerShell

복사
Name  : Language.OCR~~~el-GR~0.0.1.0
State : NotPresent

Name  : Language.OCR~~~en-GB~0.0.1.0
State : NotPresent

Name  : Language.OCR~~~en-US~0.0.1.0
State : Installed

Name  : Language.OCR~~~es-ES~0.0.1.0
State : NotPresent

Name  : Language.OCR~~~es-MX~0.0.1.0
State : NotPresent
언어와 위치는 약어이므로 "en-US"는 "english-미국"이고 "en-GB"는 "English-Great Britain"입니다. 출력에서 언어를 사용할 수 없는 경우 OCR에서 지원하지 않습니다. State: NotPresent 언어를 먼저 설치해야 합니다.

OCR 언어 팩을 설치하는 방법
다음 명령은 "en-US"에 대한 OCR 팩을 설치합니다.

PowerShell

복사
$Capability = Get-WindowsCapability -Online | Where-Object { $_.Name -Like 'Language.OCR*en-US*' }
PowerShell

복사
$Capability | Add-WindowsCapability -Online
OCR 언어 팩을 제거하는 방법
다음 명령은 "en-US"에 대한 OCR 팩을 제거합니다.

PowerShell

복사
$Capability = Get-WindowsCapability -Online | Where-Object { $_.Name -Like 'Language.OCR*en-US*' }
PowerShell

복사
$Capability | Remove-WindowsCapability -Online
문제 해결
이 섹션에서는 가능한 오류 및 솔루션을 나열합니다.

"가능한 OCR 언어가 설치되지 않았습니다."
이 메시지는 인식에 사용할 수 있는 언어가 없는 경우에 표시됩니다.

OCR 팩이 지원되고 설치되었지만 여전히 사용할 수 없으며 시스템 드라이브 X: "C:"와 다른 경우 폴더를 복사 X:/Windows/OCR 하여 C:/Windows/OCR 문제를 해결합니다.

 

+++

위 글 내용의 경우 powertoys 에서 제공하는 서식 제거 붙여넣기 기능을 이용해서 내용을 가져왔다. 

 

 

 

'Tools' 카테고리의 다른 글

jira 와 trello  (0) 2024.02.16
code-server  (0) 2023.12.31
  Comments,     Trackbacks