'유니코드'에 해당되는 글 4건
- 2011/07/25 SMI <-> SRT 자막 변환 프로그램 (멀티플랫폼 지원) (5)
- 2010/12/04 SMI <-> SRT 자막 변환 프로그램 (31)
- 2010/11/27 smi -> srt 변환 프로그램 (16)
- 2009/07/26 웹 프로그래밍의 허와 실 - Character Set (4)
SMI <-> SRT 자막 변환 프로그램 (멀티플랫폼 지원)
윈도우용은 [여기]에서 받으세요 ㅎㅎ
[실행방법]
- GUI 환경: MinySubtitleConverter.jar 을 더블클릭.
- CLI 환경: java -jar MinySubtitleConverter.jar 을 입력. (하지만 아직 GUI필요)
- 변경할 파일을 프로그램에 드래그 & 드롭
- File > Open > 파일을 선택
'컴퓨터 > 프로그래밍' 카테고리의 다른 글
| SMI <-> SRT 자막 변환 프로그램 (멀티플랫폼 지원) (5) | 2011/07/25 |
|---|---|
| SMI <-> SRT 자막 변환 프로그램 (31) | 2010/12/04 |
| smi -> srt 변환 프로그램 (16) | 2010/11/27 |
| 필요한 기능이 있어서 만들어본 이미지 뷰어 = ㅅ=;;; (2) | 2010/03/28 |
| 티스토리에서 자동으로 모바일 페이지로 이동하기 (9) | 2010/01/01 |
| 웹 프로그래밍의 허와 실 - Character Set (4) | 2009/07/26 |
-
crrr 2011/08/03 15:14
만들어주신 변환기 정말 유용하게 쓰고 있습니다. 감사합니다.
질문이 있는데요.. 아웃풋 인코딩부분에..
일반적인 smi자막 ansi인가요?? 그걸로 설정하는건 어떤걸 선택해야하는지요? 제가 사용중인 재생기중에 ansi로 인코딩된 자막만 인식하는게 있어서요 ㅠㅠ 요즘 utf-8로 제작된 자막들이 다 인식이 안되서.. 패러럴스 부팅해서 윈도우 메모장으로 일일이 다 열어서 ansi로 저장해서 보구 있거든요 ㅠㅠ 이걸로 하면 너무 간편해서 꼭 알고 싶습니다.-
화현 2011/08/04 14:46
ANSI라면... 아마 US-ASCII인데 한국어를 사용하시려면 x-windows-949나, EUC-KR을 사용하는게 맞습니다.
어떤 프로그램을 사용중이시죠? 페러럴즈를 사용하시는걸 보니 맥 유저신거 같은데 테스트해볼께요
-
-
crrr 2011/08/04 15:09
아.. 프로그램이 아니구요.. 사용중인 모니터에 usb로 외장하드나 메모리를 물려서 영화재생하는 기능이 있거든요. lg제품인데.. 메뉴얼엔 ascii 자막만 인식한다고 써있어요. 메모장으로 asni로 저장하면 재생이 되더라구요.. 알려주신 두가지 버전으로 다시 저장해서 테스트 해보겠습니다. 답변주셔서 정말 감사합니다.
SMI <-> SRT 자막 변환 프로그램
- 변경할 파일을 프로그램에 드래그 & 드롭
- File > Open > 파일을 선택
- .NET Framework 2.0 이상 [Windows XP용 다운로드]
- SMI 저장 시 맨 마지막에 자막을 닫는 테그가 안나오는 점 수정
- 팬더댄스님의 의견으로 자막 삭제에 추가
- 똑같은 내용을 담는 자막을 통합하게끔 수정
- Maximus님의 의견으로 개행 방식 설정기능 추가 (기본값: SRT=Unix, SMI=Windows)
- Help의 About의 이름이 옛 이름으로 표시되던 점 수정
- Output Charset 선택이 안되는 문제 수정
- SMI 변환 알고리즘 개선
- Input Charset 선택이 안되는 문제 수정
- 파일을 불러올 시 파일의 캐릭터셋을 자동 선택 추가(유니코드와 시스템 기본 중 자동 선택, 선택 알고리즘 때문에 약간 느려짐)
- SRT -> SMI 기능 추가
'컴퓨터 > 프로그래밍' 카테고리의 다른 글
| SMI <-> SRT 자막 변환 프로그램 (멀티플랫폼 지원) (5) | 2011/07/25 |
|---|---|
| SMI <-> SRT 자막 변환 프로그램 (31) | 2010/12/04 |
| smi -> srt 변환 프로그램 (16) | 2010/11/27 |
| 필요한 기능이 있어서 만들어본 이미지 뷰어 = ㅅ=;;; (2) | 2010/03/28 |
| 티스토리에서 자동으로 모바일 페이지로 이동하기 (9) | 2010/01/01 |
| 웹 프로그래밍의 허와 실 - Character Set (4) | 2009/07/26 |
-
-
화현 2010/12/08 00:22
Input Charset과, Output Charset을 Korean으로 맞춰 보세요
자막을 읽어들이는 프로그램이 유니코드를 지원하지 않아서 생기는 문제이거나, 원본 자막 파일이 euc-kr, cp949, 유니코드등이 아닐 가능성도 있거든요.
-
-
Maximus 2010/12/07 17:54
건의 하나 드립니다.
srt 변경후에 자막파일 열어보면 너무 복잡하더군요. 잘바꿈이 안되어서요
자막열어보면
100:00:00,010 --> 00:00:01,500큰 입200:00:01,500 --> 00:00:03,255명탐정 코난 19기 오프닝 - 「구름을 타고서」song by / 사에구사유카 IN dbopening / 아케미군 (Akemi-kun)
줄바꿈이 안되어있는데요
아래처럼 바뀌어야 한다고 봅니다.
00:00:00,010 --> 00:00:01,500
큰 입
00:00:01,500 --> 00:00:03,255
명탐정 코난 19기 오프닝 - 「구름을 타고서」
song by / 사에구사 유카 IN db
opening / 아케미군 (Akemi-kun)-
화현 2010/12/08 00:30
좋은 의견 감사합니다. ^^
설명이 될런지는 모르겠지만, 저런식으로 보이는 이유는 파일을 변환할때 UNIX시스템에 맞춰서 그렇습니다.
개행 처리방식이 3종류가 있는데요
UNIX의 \n
구 Mac의 \r (현재는 폐지)
Windows의 \r\n
아무래도 제가 아이폰이나 안드로이드 같이 UNIX, 혹은 리눅스를 기반으로 하는 운영체제를 타겟으로 한거라 UNIX식으로 변환을 했습니다.
이런 개행처리를 지원하는 프로그램(EditPlus같은...)으로 보시면 정상적으로 개행이 되어 보일것입니다 ^^
-
-
-
-
-
-
팬더댄스 2010/12/26 16:37
와 좋습니다. 다른프로그램은 오류나서 변환 못하는것도 잘되네요.잘쓰겠습니다~
한가지 srt를 smi로 변환할때 가 없어서 다음 대사가 없을때는 이전 대사가 계속 남아요.
<SYNC Start=23780><P Class=KRCC>
아주 은밀한 비밀도 가지고 있었죠
<SYNC Start=26350>
<SYNC Start=26450><P Class=KRCC>아가
이렇게 변환되는데 26350> 뒤에 <P Class=KRCC> 가 있으면 완벽할듯해요~ -
-
화현 2011/01/09 18:44
헛, 아이패드만 안나오나요? 혹시 모르니 제 메일 주소(myhyuny@live.com)로 자막 파일을 보내 주실 수 있나요? 테스트 해 볼께요 ㅎㄷ
-
-
하하하 2011/01/09 15:38
왜 저는안되죠?;;
unhandled exception has occurred in your application. if you click continue, the application will ignore this error and attempt to continue. if you click quit, the application will close immediately.
the type initializer for 'MinySubtitleConverer. ThreadPoolManager' threw an exception
처리되지 않은 예외는 응용 프로그램에서 발생했습니다. 계속을 클릭하면 응용 프로그램이 오류가 계속 시도를 무시합니다. 당신이 종료를 클릭하면, 응용 프로그램이 즉시 종료됩니다.
MinySubtitleConverer '에 대한 형식 초기화. 어쩌구 하면서 오류가 뜨는데 어떻하죠 ;;-
화현 2011/01/09 18:47
헛, 죄송합니다. ㅠㅠ
좀 더 자세한 상황을 알려주실 수 있나요?
OS버전이랑 설치되어 있는 .NET버전 에러 발생 시점과 좀 더 상세한 에러 메세지 같은거요...
-
-
dhygns 2011/08/08 23:58
Unable to find a version of the runtime to run this application 이라고 뜨면서 실행이 안된에ㅛ
-
화현 2011/08/09 09:53
.NET Framework가 설치되지 않아서 그렇습니다.
http://www.microsoft.com/downloads/ko-kr/details.aspx?FamilyID=ab99342f-5d1a-413d-8319-81da479ab0d7
여기로 가셔서 받아서 설치하고 실행해 보세요
-
smi -> srt 변환 프로그램
- .NET에서 지원하는 모든 인코딩셋 지원
- 초기화 속도 개선
- 정보의 버전 표시가 제대로 안된점 수정
- HTML Entity 변환 지원
- 멀티코어 CPU 지원 (응?)
- 변환 알고리즘 변경(호환성 개선, 쓸데없는 문자 자동 제거)
- 화면 구성 수정
'컴퓨터 > 프로그래밍' 카테고리의 다른 글
| SMI <-> SRT 자막 변환 프로그램 (멀티플랫폼 지원) (5) | 2011/07/25 |
|---|---|
| SMI <-> SRT 자막 변환 프로그램 (31) | 2010/12/04 |
| smi -> srt 변환 프로그램 (16) | 2010/11/27 |
| 필요한 기능이 있어서 만들어본 이미지 뷰어 = ㅅ=;;; (2) | 2010/03/28 |
| 티스토리에서 자동으로 모바일 페이지로 이동하기 (9) | 2010/01/01 |
| 웹 프로그래밍의 허와 실 - Character Set (4) | 2009/07/26 |
웹 프로그래밍의 허와 실 - Character Set
EUC-KR 이 유니코드보다 한글을 더 많이 지원한다?
요즘엔 어떨찌 모르겠는데 예전에 EUC-KR이 유니코드보다 한글을 완벽히 지원한다고 해서 유니코드가 안좋다는 식으로 이야기 하던 시절이 있었습니다. 하지만, 원칙적으로는 EUC-KR은 유니코드보다 한글 표현 및 한자 표현에 제한이 좀 많습니다. 예를들어 10년전 한컴에서 윈도우95에서 표현 못하지만 한글에서 표현 가능하다던 '똠방각하' 라던지, 예전에 DC에서 유행했던 '아햏햏', '쀍' 같은것은 물론 상당히 많은 수의 한글과, 한자를 사용 못합니다.
EUC-KR은 소스 코드 상에서 똠, 햏, 쀍 같은 글자가 코드로 나타난다.
물론 브라우저 상에서는 잘 나올수도 있습니다만 언제까지나 브라우저에서 처리를 하는거라 많은 문제가 발생합니다.
그럼 이 문제를 어떻게 해결 가능하냐...
사실 이 문제는 10년전에 이미 해결 된 상태입니다 =ㅅ=;;;
UHC, MS949로 불리는 CP949코드를 사용하면 해결 가능한데 EUC-KR의 확장 코드이고, 한글 윈도우의 기본 인코딩셋이라 Content-Type의 캐릭터셋을 cp949나, uhc로 변경하면 곧바로 사용 가능합니다.
charset을 uhc로만 바꿨을 뿐인데 잘 작동 된다
그리고 이론적으로 유니코드가 CP949보다 훨씬 더 많은 한글를 지원합니다.(모든 한글은 물론 옛한글 표현 가능) 단지 표현할 수 있는 프로그램이 극히 적어서 활용을 못할 뿐이지만요... (자세한것은 검색을)
유니코드와 UTF-8은 같다 다르다?
마치, Rock와, Metal은 같다(혹은 다르다)와, R&B와, Soul은 같다(혹은 다르다)와 비슷한 맥략입니다.
UTF-8은 유니코드의 한 종류입니다. (Metal은 Rock의 한 종류고, Soul은 R&B의 한 종류죠)
UTF-8의 한글 코드는 1캐릭터당 2바이트다
이 부분은 유니코드와 UTF-8의 구조를 알아야 하는 부분입니다. 일단, UTF-8은 ASCII 코드를 제외한 코드들을 1캐릭터당 2~4바이트로 표현합니다. 한글은 3바이트로 표현 되더군요. 그리고 한글중에 좀 특별한 경우(옛 한글이나, 조합형) 같은 경우에는 그 이상이 됩니다. 즉... 가변 -ㅅ-;;;
자바스크립트는 현재 페이지의 캐릭터셋을 사용한다.
자바스크립트 기본 캐릭터셋은 UTF-8입니다. 그리고 브라우저마다 다를 수 있겠지만 페이지 케릭터셋이 latin-1이나, euc-kr, uhc 어느것이더라도 자바스크립트에서 utf-8로 변환됩니다.
URL에 (혹은 GET메서드나, 파일명에) 한글을 넣어도 된다.
ASCII코드만 넣을 수 있습니다. (자세한것은 나중에) 그래도 혹시 넣는다면 UTF-8을 권장합니다. 거의 모든 브라우저가 한글을 UTF-8로 변환한 뒤, URL Encoding을 해서 전송하기 때문입니다...
결론은... UTF-8이 진리. -ㅅ-+
덧] 혹시 궁금한거 있으시면 꼭 캐릭터 셋이 아니더라도 질문해주세요... 제가 아는거면 추가 시킬께요 ㄷㄷ
'컴퓨터 > 프로그래밍' 카테고리의 다른 글
| 필요한 기능이 있어서 만들어본 이미지 뷰어 = ㅅ=;;; (2) | 2010/03/28 |
|---|---|
| 티스토리에서 자동으로 모바일 페이지로 이동하기 (9) | 2010/01/01 |
| 웹 프로그래밍의 허와 실 - Character Set (4) | 2009/07/26 |
| 웹 프로그래밍의 허와 실 - 들어가기 앞서서 (2) | 2009/07/25 |
| 간단한 웹 서버 프로그램 거의 다 만들었습니다. (5) | 2009/03/07 |
| 간단한 웹 서버 제작에 들어가기 앞서서 (0) | 2009/02/20 |
MinySubtitleConverter.jar
MinySubtitleConverter.exe
