본문 바로가기

Python

[PYTHON] PDF 파일을 Word로 변환하기 by ChatGPT

반응형

https://youtu.be/ijRlwFh6N7Y

 

이번 시간에는 PDF파일을 Word로 변환하는 것을 ChatGPT를 이용하여 Python으로 작성해 보겠습니다.

저는 그저 내가 원하는 것을 떠들뿐, 일은 ChatGPT가 하는 것입니다.

말 그대로 pdf파일을 읽어서 word로 변환해 주는 것인데, 단순해 보이지만, 실제로 내부 로직은 고민할 거리가 있어야 가능한데 다행히도 똑똑한 분들이 pdf 에서 word로 만드는 것을 모듈로 만들어 두었습니다.

바로 pdf2docx라는 모듈을 설치하고 진행하시면 되겠습니다. 

내가 원하는  pdf파일을 선택하고 변환하라고 누르기만 하면 바로 word로 변경하도록 하는 단순한 기능입니다.

본인이 직접 만들면 편한데, 인터넷 사이트에 개인 정보를 알려 주면서 사용들 하고 그러셨을텐데 이제는 직접 만들어서 사용하시기 바랍니다. GUI구성은 아래처럼 진행했습니다.

 

 

결과 파일은  동일한 폴더아래에 확장자만 docx로 변경하는 것으로 해 달라고 요청했습니다. 

파일이 클 경우를 대비해서 Progress기능을 넣어 달라고 했는데, 이 부분은 제대로 동작하지 않는 것으로 보입니다.

파일 하나씩 진행할때는 문제가 없더라도, 이걸 확장해서 폴더 단위로 모든 pdf를 변환할때는 반드시 필요한 기능이라 일단 넣은 채로 진행했습니다. 단 제약사항은 암호가 걸린 파일이라든가 일부 특정한 경우에는 진행오류가 생기는 것 같습니다. 구체적으로 문제가 생기는 경우는 별도로 처리하셔야겠습니다.

기본적인 변환 작업에는 문제가 없었습니다.

아래는 최종  Python code입니다.

PDF2DOCX_v0.9.py
0.00MB

 

실행 파일은 사이즈가 커서 실행파일 만드는 방법만 기존과 같이 알려 드립니다.

pyinstaller -w -F PDF2DOCX_v0.9.py

 

PDF를 편집하고 싶은데 Tool이 없어서 힘들었던 분들에게 도움이 되기 바랍니다.

반응형