Skip to content

fix(encoding): ISO-2022-JPのページで文字化けが発生する問題を修正#40

Draft
kakkokari-gtyih wants to merge 2 commits intomisskey-dev:masterfrom
kakkokari-gtyih:fix-39
Draft

fix(encoding): ISO-2022-JPのページで文字化けが発生する問題を修正#40
kakkokari-gtyih wants to merge 2 commits intomisskey-dev:masterfrom
kakkokari-gtyih:fix-39

Conversation

@kakkokari-gtyih
Copy link

@kakkokari-gtyih kakkokari-gtyih commented Nov 19, 2024

  • ISO-2022-JPのページで文字化けが発生する問題を修正
  • 文字コードの特定にも失敗していたので、可能ならばレスポンスヘッダから文字コードを取得するように仕様変更

Fix #39

@mei23
Copy link

mei23 commented Dec 25, 2024

文字コードの特定にも失敗していたので、可能ならばレスポンスヘッダから文字コードを取得するように仕様変更

Header: text/html; charset=ISO-8859-1
Meta: text/html; charset=Shift_JIS

みたいにHeaderが間違ってるサーバーだとどうなるかしら?

Apacheでディストリとかによっては、AddDefaultCharsetでヘッダーのcharsetが不正な値に固定されてしまっていることが稀にあるはずだわ。

@mei23
Copy link

mei23 commented Dec 25, 2024

文字コードの特定にも失敗していたので

https://www.comiket.co.jp/info-c/C97/C97genre.html の認識は成功してる気がするのだわ

detected { encoding: 'ISO-2022-JP', confidence: 0.99 }

@kakkokari-gtyih kakkokari-gtyih marked this pull request as draft February 2, 2025 04:29
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

None yet

Projects

None yet

Development

Successfully merging this pull request may close these issues.

ISO-2022-JPのページが文字化けする

2 participants