본문 바로가기
IT, Software/Python

특정 문자열을 찾아 텍스트 분할하는 어플 - Blice Text Splitter

by 기타마을이장 2021. 2. 15.

최근 혼자 하고 있는 Python으로 윈도우 어플 만들기의 시작은 사실 업무와 관련이 있었다.

작년까지 내가 담당하던 업무는 웹소설 콘텐츠를 유통하고 관리하는 플랫폼 PM업무였고,

당시 필요했던 기능중에 하나가 바로 확보한 콘텐츠(Text파일)에서 특정 문자열을 찾아 분할하는 기능이 필요했다.

서버의 기능으로 제공해주면 더욱 좋겠지만 또 아주 일반적으로 널리 쓰이는 기능은 아니다 보니

그냥 어플 형태로 직접 한번 만들어보기로 결심하고 시작하게 됐다.

그리고 UI가 멋스럽진 않지만, 기능에만 충실한... 간단한 어플이 완성되어 정리해본다.

 

그간 나름 스터디했던 Python으로 윈도우 어플 만들기 관련 각종 필요기술들을 활용해서

특정 문자열을 찾아 각각의 텍스트 파일로 분리해서 저장시켜주는 어플

블라이스 회차 분할기(Blice Text Splitter)

 

다양한 형식의 텍스트 포맷들을 지원하면 좋겠지만, 딱 내가 필요한 기능만 넣다 보니;;; 매우 단순하다ㅎㅎ

그래도 뭔가 미숙하고 기능도 단출하지만 의미 있는 결과물이 나온 것 같아 뿌듯하다.

파일 지원 포맷

  • 대상 파일 : UTF-8 형식의 txt 파일들만 안정적으로 텍스트 분리가 가능(doc, hwp 등 지원 안됨)
  • 출력 파일 : 분할된 텍스트들은 UTF-8 BOM 형식으로 저장

사용방법

  1. 파일 열기
    분할하려는 원본 파일을 열면, 첫 100라인을 분석해서 텍스트 내 문자열 인코딩 상태를 체크해서 표시함
  2. 구분자
    분할을 하기 위한 구분자를 입력
  3. 회차 시작번호
    출력 파일명은 ' 원본파일명-(회차시작번호)화.txt ' 형태이다.(ex. test-1화.txt)
    기본 1로 설정되고, 필요시 숫자를 변경하면 해당 숫자부터 파일명 뒷부분이 결정된다.
  4. 첫 줄 파일명으로
    출력 파일명을 ' 원본파일명-(회차시작번호)화.txt ' 형태 대신
    분할되는 파일의 제일 첫번째 줄의 문자열(구분자 다음에 오는 문자열)을 파일명으로 하고 싶을 때 체크
    ex) 체크 시 ' test-2화.txt ' 대신 ' 테스트 1회.txt ' 파일로 생성됨.
  5. 변환 중지 
    중간에 이상하다 싶으면 중단할 수 있다.
    하지만, 텍스트만 다루는 어플이다 보니 중단하기 전에 대부분 분할동작이 끝나버린다.

테스트에 사용한 txt 파일, 분할 결과

원본파일 >> 원본파일_(회차번호)화.txt 형태로 저장 >> 첫줄 파일명으로 저장

실행파일 다운받기

블라이스 회차분할기 v1.0.0.exe

 

FidelisLee/BliceTextSplitter

Contribute to FidelisLee/BliceTextSplitter development by creating an account on GitHub.

github.com

마지막으로, 새로운 웹소설 플랫폼인 블라이스가 더 번창하길 기원해본다ㅎㅎ

 

블라이스

무료 웹소설, 로맨스, 로판, 판타지, 현판, 무협, 인기 웹소설 연재 플랫폼

www.blice.co.kr

 

반응형

댓글