์ด ํ๋ก์ ํธ๋ ๋ค์ํ ํ์ผ ํ์์ ์ฒ๋ฆฌํ๊ณ ๋ณํํ ์ ์๋ ๊ฐ๋ ฅํ Streamlit ๊ธฐ๋ฐ ์น ์ ํ๋ฆฌ์ผ์ด์ ์ ๋๋ค. PPT์์ PDF๋ก์ ๋ณํ, ์ด๋ฏธ์ง ๋ถ์, OCR ๋ฑ ๋ค์ํ ๊ธฐ๋ฅ์ ์ ๊ณตํฉ๋๋ค.
- PPT๋ฅผ PDF๋ก ๋ณํ: PowerPoint ํ๋ ์ ํ ์ด์ ์ PDF ํ์์ผ๋ก ๋ณํํฉ๋๋ค.
- PDF๋ฅผ ์ด๋ฏธ์ง๋ก ๋ณํ: PDF ํ์ผ์ ๊ฐ ํ์ด์ง๋ฅผ ๊ฐ๋ณ ์ด๋ฏธ์ง๋ก ๋ณํํฉ๋๋ค.
- ์ด๋ฏธ์ง ๋ถ์: ๊ณ ๊ธ Vision-Language ๋ชจ๋ธ์ ์ฌ์ฉํ์ฌ ์ด๋ฏธ์ง๋ฅผ ๋ถ์ํ๊ณ ์ค๋ช ํฉ๋๋ค.
- OCR (๊ดํ ๋ฌธ์ ์ธ์): PDF ๋๋ ์ด๋ฏธ์ง์์ ํ ์คํธ๋ฅผ ์ถ์ถํฉ๋๋ค.
- TXT๋ฅผ PDF๋ก ๋ณํ: ํ ์คํธ ํ์ผ์ PDF ํ์์ผ๋ก ๋ณํํฉ๋๋ค.
- PDF๋ฅผ HTML๋ก ๋ณํ: PDF ํ์ผ์ HTML ํ์์ผ๋ก ๋ณํํฉ๋๋ค.
- PDF์์ ์ด๋ฏธ์ง ์ถ์ถ: PDF ํ์ผ์ ํฌํจ๋ ์ด๋ฏธ์ง๋ฅผ ์ถ์ถํ๊ณ OCR์ ์ํํฉ๋๋ค.
-
์ ์ฅ์๋ฅผ ํด๋ก ํฉ๋๋ค:
git clone https://github.com/nakjun/python-data-parser.git -
ํ์ํ ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ฅผ ์ค์นํฉ๋๋ค:
pip install -r requirements.txt -
์ ํ๋ฆฌ์ผ์ด์ ์ ์คํํฉ๋๋ค:
streamlit run main.py streamlit run main.py --server.port 9999 # ์ํ๋ ํฌํธ๋ก ๋ณ๊ฒฝ๊ฐ๋ฅ
- ์น ๋ธ๋ผ์ฐ์ ์์ ์ ํ๋ฆฌ์ผ์ด์ ์ ์ฝ๋๋ค.
- ์ฌ์ด๋๋ฐ์์ ์ํ๋ ๊ธฐ๋ฅ์ ์ ํํฉ๋๋ค.
- ์ง์์ ๋ฐ๋ผ ํ์ผ์ ์ ๋ก๋ํ๊ณ ์ฒ๋ฆฌํฉ๋๋ค.
- ๊ฒฐ๊ณผ๋ฅผ ํ์ธํ๊ณ ํ์ํ ๊ฒฝ์ฐ ๋ค์ด๋ก๋ํฉ๋๋ค.
ํ๋ก์ ํธ์ ๊ธฐ์ฌํ๊ณ ์ถ์ผ์ ๊ฐ์? ํ๋ฅญํฉ๋๋ค! ๋ค์ ๋จ๊ณ๋ฅผ ๋ฐ๋ผ์ฃผ์ธ์:
- ์ด ์ ์ฅ์๋ฅผ ํฌํฌํฉ๋๋ค.
- ์ ๋ธ๋์น๋ฅผ ๋ง๋ญ๋๋ค (
git checkout -b feature/Features). - ๋ณ๊ฒฝ ์ฌํญ์ ์ปค๋ฐํฉ๋๋ค (
git commit -m 'Add some Features'). - ๋ธ๋์น์ ํธ์ํฉ๋๋ค (
git push origin feature/Features). - Pull Request๋ฅผ ์ด์ด์ฃผ์ธ์.
ํ๋ก์ ํธ ๊ด๋ฆฌ์ - โ๏ธ njsung1217@gmail.com
โญ๏ธ ์ด ํ๋ก์ ํธ๊ฐ ๋์์ด ๋์๋ค๋ฉด ์คํ๋ฅผ ๋๋ฌ์ฃผ์ธ์!