Word, Excel 및 PowerPoint 문서에서 이미지, 텍스트 및 포함 파일을 추출하는 방법

0
1283

00_lead_image_extract_images_from_word_file

누군가가 많은 이미지가 포함 된 Word 문서를 보냈다고 말하고 해당 이미지를 하드 드라이브에 저장하려고한다고 가정하십시오. 간단한 방법으로 Microsoft Office 문서에서 이미지를 추출 할 수 있습니다.

이미지 또는 기타 파일이 포함 된 aWord (.docx), Excel (.xlsx) 또는 PowerPoint (.pptx) 파일이있는 경우 각 파일을 별도로 저장하지 않고도 추출 할 수 있습니다 (문서의 텍스트뿐만 아니라). . 무엇보다도 추가 소프트웨어가 필요하지 않습니다. Office XML 기반 파일 형식 (docx, xlsx 및 pptx)은 실제로 Windows에서 일반 .zip 파일처럼 열 수있는 압축 된 압축 파일입니다. 여기에서 이미지, 텍스트 및 기타 포함 된 파일을 추출 할 수 있습니다. Windows의 기본 제공 .zip 지원 또는 원하는 경우 7-Zip와 같은 앱을 사용할 수 있습니다.

.doc, .xls 또는 .ppt 파일과 같은 오래된 사무실 문서에서 파일을 추출해야하는 경우 작은 자유 소프트웨어를 사용하여 파일을 추출 할 수 있습니다. 이 가이드의 끝 부분에서 해당 프로세스를 자세히 설명합니다.

최신 Office 파일 (.docx, .xlsx 또는 .pptx)의 내용을 추출하는 방법

XML 기반 Office 문서의 내부 내용에 액세스하려면 파일 탐색기 (또는 Windows 7의 Windows 탐색기)를 열고 내용을 추출 할 파일로 이동 한 다음 파일을 선택하십시오.

01_pressing_f2_to_rename_file

“F2”를 눌러 파일 이름을 바꾸고 확장자 (.docx, .xlsx 또는 .pptx)를“.zip”으로 변경하십시오. 파일 이름의 주요 부분 만 남겨 두십시오. 완료되면 “Enter”를 누르십시오.

02_changing_extension_to_zip

다음 대화 상자에는 파일 이름 확장명 변경에 대한 경고가 표시됩니다. “예”를 클릭하십시오.

02a_ 이름 변경 확인

Windows는 파일을 압축 파일로 자동 인식합니다. 파일의 내용을 추출하려면 파일을 마우스 오른쪽 버튼으로 클릭하고 팝업 메뉴에서 “전체 추출”을 선택하십시오.

03_selecting_extract_all

“대상 선택 및 파일 추출”대화 상자에서 .zip 파일의 내용이 추출 될 경로가“파일이이 폴더로 추출됩니다”편집 상자에 표시됩니다. 기본적으로 파일 이름이없는 파일 이름과 동일한 이름의 폴더는 .zip 파일과 같은 폴더에 만들어집니다. 파일을 다른 폴더로 추출하려면 “찾아보기”를 클릭하십시오.

04_clicking_browse

필요한 경우“새 폴더”를 클릭하여 .zip 파일의 내용을 추출 할 위치로 이동하여 새 폴더를 만듭니다. “폴더 선택”을 클릭하십시오.

05_creating_new_folder_and_selecting_it

압축을 푼 파일이 들어있는 폴더가있는 파일 탐색기 (또는 Windows 탐색기) 창을 열려면“완료되면 압축이 풀린 파일 표시”확인란을 선택하여 상자에 확인 표시를하십시오. “추출”을 클릭하십시오.

06_clicking_extract

추출 된 이미지에 액세스하는 방법

원본 파일이 Word 문서 인 경우 (또는 Excel 문서의 경우 “xl”또는 PowerPoint 문서의 경우 “ppt”) 추출 된 내용에 “word”라는 폴더가 포함됩니다. “word”폴더를 두 번 클릭하여 엽니 다.

07_opening_word_folder

“media”폴더를 두 번 클릭하십시오.

08_opening_media_folder

원본 파일의 모든 이미지는 “media”폴더에 있습니다. 추출 된 파일은 문서에서 사용 된 원본 이미지입니다. 문서 안에 크기 조정 또는 기타 속성이 설정되어 있지만 추출 된 파일은 이러한 속성이 적용되지 않은 원시 이미지입니다.

09_images_from_file

추출 된 텍스트에 액세스하는 방법

PC에 Office가 설치되어 있지 않고 Word (또는 Excel 또는 PowerPoint) 파일에서 텍스트를 추출해야하는 경우 “word”폴더의 “document.xml”파일에서 추출 된 텍스트에 액세스 할 수 있습니다. .

10_document_xml_file

메모장이나 워드 패드와 같은 텍스트 편집기에서이 파일을 열 수 있지만 무료 프로그램 인 XML 메모장과 같은 특수 XML 편집기에서 읽기가 더 쉽습니다. 파일의 모든 텍스트는 문서 자체에 적용된 스타일 및 / 또는 형식에 관계없이 일반 텍스트 청크로 제공됩니다. 물론이 텍스트를보기 위해 무료 소프트웨어를 다운로드하려는 경우 Microsoft Office 문서를 읽을 수있는 LibreOffice를 다운로드 할 수도 있습니다.

11_document_xml_file_open_in_xml_notepad

포함 된 OLE 개체 또는 첨부 파일을 추출하는 방법

Word에 액세스 할 수 없을 때 Word 문서에 포함 된 파일에 액세스하려면 먼저 Windows에 기본 제공되는 WordPad에서 Word 파일을 엽니 다. 포함 된 파일 아이콘 중 일부는 표시되지 않지만 여전히 있습니다. 포함 된 파일 중 일부에 파일 이름이있을 수 있습니다. 워드 패드는 모든 Word 기능을 지원하지 않으므로 일부 내용이 잘못 표시 될 수 있습니다. 그러나 파일에 액세스 할 수 있어야합니다.

샘플 Word 파일에 포함 된 파일 중 하나를 마우스 오른쪽 버튼으로 클릭하면 “PDF 개체 열기”옵션이 있습니다. PC의 기본 PDF 리더 프로그램에서 PDF 파일이 열립니다. 여기에서 PDF 파일을 하드 드라이브에 저장할 수 있습니다.

11a_opening_pdf_file

워드 패드에 파일을 열 수있는 옵션이 없으면 여기에서 파일 형식을 기록해 두십시오. 예를 들어이 문서의 두 번째 파일은 .mp3 파일입니다.

그런 다음 “Files from (Document)”폴더로 돌아가서 “word”폴더 안에있는 “embeddings”폴더를 두 번 클릭하십시오.

12_embeddings_folder

불행하게도 파일 형식은 파일 이름에 유지되지 않습니다. 모두 “.bin”파일 확장자를 갖습니다. 파일에 어떤 유형의 파일이 포함되어 있는지 아는 경우 파일 크기에 따라 어떤 파일이 어떤 것인지 추론 할 수 있습니다. 이 예에서는 문서에 PDF 파일과 MP3 파일이 포함되어 있습니다. MP3 파일은 PDF 파일보다 크기가 클 가능성이 높으므로 파일 크기를보고 올바른 확장자를 사용하여 파일 이름을 바꾸면 어떤 파일인지 확인할 수 있습니다. 아래는 MP3 파일의 이름을 바꾸는 것입니다.

13_extracted_embedded_files

워드 패드에서 PDF 파일을 올바르게 열었을 때와 같이 모든 파일이 반드시이 프로세스를 사용하여 열리지는 않습니다. 그러나 .bin 파일의 이름을 바꿔 파일을 열 수는 없습니다.

압축 파일의 내용을 추출한 후 원본 파일의 확장자를 .docx, .xlsx 또는 .pptx로 되돌릴 수 있습니다. 파일은 그대로 유지되며 해당 프로그램에서 정상적으로 열 수 있습니다.

오래된 Office 문서에서 이미지를 추출하는 방법 (.doc, .xls 또는 .ppt)

Office 2003 (또는 그 이전 버전) 문서에서 이미지를 추출해야하는 경우이 작업을 쉽게 수행 할 수있는 무료 도구 인 Office 이미지 추출 마법사가 있습니다. 이 프로그램을 사용하면 한 번에 여러 문서 (동일 또는 다른 유형)에서 이미지를 추출 할 수도 있습니다. 프로그램을 다운로드하여 설치하십시오 (설치하지 않으려는 경우 휴대용 버전도 제공됨).

프로그램을 실행하면 시작 화면이 표시됩니다. “다음”을 클릭하십시오.

14_welcome_screen

먼저 이미지를 추출 할 파일을 선택해야합니다. 입력 및 출력 화면에서 문서 편집 상자 오른쪽의 “찾아보기”(폴더 아이콘) 버튼을 클릭하십시오.

15_clicking_browse_for_document

원하는 문서가 들어있는 폴더로 이동하여 선택하고 “열기”를 클릭하십시오.

16_opening_word_file

선택한 파일이 포함 된 폴더가 자동으로 출력 폴더가됩니다. 해당 폴더 내에 선택한 파일과 동일한 이름의 하위 폴더를 만들려면 “여기에 폴더 만들기”확인란을 클릭하여 상자에 확인 표시를하십시오. 그런 다음 “다음”을 클릭하십시오.

17_clicking_next

시작 준비 화면에서“시작”을 클릭하여 이미지 추출을 시작하십시오.

18_ready_to_start

추출이 진행되는 동안 다음 화면이 표시됩니다.

19_processing_please_wait

완료 화면에서“대상 폴더를 열려면 여기를 클릭하십시오”를 클릭하여 결과 이미지 파일을 봅니다.

20_opening_destination_folder

하위 폴더를 만들도록 선택 했으므로 파일에서 추출 된 이미지 파일이 들어있는 폴더가 생성됩니다.

21_opening_subfolder

모든 이미지가 번호가 매겨진 파일로 표시됩니다.

22_images_from_older_word_file

한 번에 여러 파일에서 이미지를 추출 할 수도 있습니다. 이렇게하려면 입력 및 출력 화면에서 “배치 모드”확인란을 클릭하여 상자에 확인 표시를합니다.

23_clicking_batch_mode

배치 입력 및 출력 화면이 표시됩니다. “파일 추가”를 클릭하십시오.

24_clicking_add_files

열기 대화 상자에서 이미지를 추출 할 파일이 들어있는 폴더로 이동 한 다음 “Shift”또는 “Ctrl”키를 사용하여 파일을 선택하고 여러 파일을 선택한 다음 “Open”을 클릭합니다.

“파일 추가”를 다시 클릭하고 열기 대화 상자의 폴더로 이동하여 원하는 파일을 선택한 다음 “열기”를 클릭하여 다른 폴더에서 파일을 추가 할 수 있습니다.

25_opening_files

이미지를 추출 할 파일을 모두 추가 한 후에는 “폴더 만들기”를 클릭하여 이미지 파일을 저장할 각 문서와 동일한 폴더 내에서 각 문서에 대해 별도의 폴더를 만들도록 선택할 수 있습니다. 각 문서”확인란을 선택하면 상자에 확인 표시가 나타납니다.

26_clicking_next_on_batch_mode

출력 폴더를 “각 파일의 입력 폴더와 동일”으로 지정하거나 해당 옵션 아래의 편집 상자와 “찾아보기”버튼을 사용하여 사용자 정의 폴더를 입력하거나 선택할 수 있습니다. 원하는 옵션을 선택했으면“다음”을 클릭하십시오.

26a_specifying_output_folder

Ready to Start 화면에서“Start”를 클릭하십시오.

27_ready_to_start_for_batch_mode

추출 진행 상황을 보여주는 다음 화면이 표시됩니다.

28_processing_screen

추출 된 이미지 수가 완료 화면에 표시됩니다. “닫기”를 클릭하여 Office 이미지 추출 마법사를 닫습니다.

29_closing_wizard

각 문서에 대해 별도의 폴더를 만들도록 선택한 경우 이미지가 포함 된 파일과 이름이 같은 폴더 (지정한 출력 폴더)가 표시됩니다.

30_ 폴더 _ 포함 _ 이미지

다시, 우리는 모든 이미지를 각 문서의 번호가 매겨진 파일로 얻습니다.

31_images_from_one_file

이제 이미지의 이름을 바꾸고 이동 한 다음 자신의 문서에서 사용할 수 있습니다. 합법적으로 사용할 권리가 있는지 확인하십시오.