wordpress とcsv importerで日本語を読み込みたいから引用符を付けたのに引用符まで表示される問題のつづき
とあるブログでご相談してみたら、「文字コードはUTF-8Nになってますか?」というご質問をいただいた。
N?
Nっちゃあなんかね?
(りさーち後)はい、UTF-8にはオプションがあるのね。「BOMなし」というものがあるようです。勉強になった。
ここからは、その方にお返事した内容。
=========
確認した結果、csv変換に使っていたテキストエディタ(Jedit)の設定はUTF-8Nとなっていました。また、Jeditのその他の設定はWordPress Codex 日本語版で推奨されているものと少し違っていたので(チルダの変換など)、合わせてから再度保存、そしてインポートをしましたが、やはりクォーテーションが一緒に出てきます。
ちなみに、現在取り扱っているファイルのインポートの手順は
1)元のデータとなるQuark ExpressファイルをInDesignで開き、テキストをコピー
2)1)をエクセルの表に貼付け、csv形式で保存
3)Jeditで2)のcsvファイルを開く
4)Jeditで[文字コードをUTF-8N、改行コードをLF]にしてcsv形式で保存
5)wordpress上でcsv importerを使用
です。
csvとなったデータをよく見てみると、問題のある項目の前後にクォーテーションが三重になってついていました(手作業で付けたのは前後に1つずつ)。これを削除して1つのみにした項目は、正常に表示されました。
実はエクセルの枠の中には、クォーテーションで囲まなくても正常に表示される日本語項目があることに気づきました。そこで今、どうすれば確実に正しく表示されるのかをテスト中ですが、まだ結論が出ていません。
ひとまず、wordpressにインポートする直前のcsvファイル上で、三重クォーテーションを一括して置き換えるだけでも、phpを開いて1つずつ消して回るより圧倒的に楽なので、この方法で進めつつ、また解決策を探していきたいと思います。
=======
ってわけで、今ココ。
今後も、とりあえずココ。
何が原因なんだろうなあ。何が違うんだろうなあ…。ささいなことなのか、ウェブのプロなら知ってて当たり前の環境の仕様みたいなものがあるのか…。
N?
Nっちゃあなんかね?
(りさーち後)はい、UTF-8にはオプションがあるのね。「BOMなし」というものがあるようです。勉強になった。
ここからは、その方にお返事した内容。
=========
確認した結果、csv変換に使っていたテキストエディタ(Jedit)の設定はUTF-8Nとなっていました。また、Jeditのその他の設定はWordPress Codex 日本語版で推奨されているものと少し違っていたので(チルダの変換など)、合わせてから再度保存、そしてインポートをしましたが、やはりクォーテーションが一緒に出てきます。
ちなみに、現在取り扱っているファイルのインポートの手順は
1)元のデータとなるQuark ExpressファイルをInDesignで開き、テキストをコピー
2)1)をエクセルの表に貼付け、csv形式で保存
3)Jeditで2)のcsvファイルを開く
4)Jeditで[文字コードをUTF-8N、改行コードをLF]にしてcsv形式で保存
5)wordpress上でcsv importerを使用
です。
csvとなったデータをよく見てみると、問題のある項目の前後にクォーテーションが三重になってついていました(手作業で付けたのは前後に1つずつ)。これを削除して1つのみにした項目は、正常に表示されました。
実はエクセルの枠の中には、クォーテーションで囲まなくても正常に表示される日本語項目があることに気づきました。そこで今、どうすれば確実に正しく表示されるのかをテスト中ですが、まだ結論が出ていません。
ひとまず、wordpressにインポートする直前のcsvファイル上で、三重クォーテーションを一括して置き換えるだけでも、phpを開いて1つずつ消して回るより圧倒的に楽なので、この方法で進めつつ、また解決策を探していきたいと思います。
=======
ってわけで、今ココ。
今後も、とりあえずココ。
何が原因なんだろうなあ。何が違うんだろうなあ…。ささいなことなのか、ウェブのプロなら知ってて当たり前の環境の仕様みたいなものがあるのか…。
Comments
Post a Comment