こんなHTMLファイル名は嫌だ!知らないと恥ずかしい「名付け」の問題(後編)(1/2)
ユーザーにとってわかりやすい「名前」とは
Webサイトにとって「名前」がどんな役割を担っていて、うっかりするとどんな問題がおきるか?については前編で解説しました。
訪問者にとってわかりやすく、管理者にとって合理的な「名前」は、具体的にどんなところに注意すれば良いか、名付けの処方せんをご紹介します。
ざっくりわかる処方せん(基本編)
-
日本語NG
これはもう、「絶対」です。
ファイル名に日本語というか、マルチバイト文字を使うことは避けましょう。ファイル名がカタカナ以外の半角英数記号ではない場合、URLとしてはそのファイル名を一旦UTF-8でエンコードし直し、さらにパーセントエンコードした文字列に変換しなければなりません(RFC3986 2.5, URL Standard 4.4)。Wikipediaの日本語な記事のURLをコピーして、貼り付けてみるとやたらと長い記号を交えた文字列になってしまう、例のアレです。パーセントエンコードされた状態は扱いにくいだけでなく、パスの指定をミスするなどの事故につながりかねません。
無難なのは英語にしておくことですが、適切な翻訳語がない固有名詞などの場合、ローマ字綴りでもよいのでアルファベットにしましょう。さらに、大文字は使わず、小文字だけにしておくことです。使う文字もa-zと0-9、半角ハイフン、半角アンダーバーとドットに限定しておきましょう。この範囲を使えないOSはそもそも使い物にならないので、後日サーバが切り替わってファイルを移動しなければならなくなった時にも困りません。
あと、英語にしたら違和感があるような場合は、遠慮せずに他社の例を参考にしてみましょう。
例えば会社概要だけでも、- /company/information/
- /ja/jp/about/company/profile/
- /company/overview/
- /about.html
- /outline.html
- /jp-ja/company-japan-over-facts
など、いろいろな形が使われています。
-
インデックスは省略すべし
後日Googleアナリティクスなどでアクセスを解析する場合、あらかじめURLが正規化されていると便利です。
このため、インデックスページについては /index.html や /index.php などのファイル名を省略するようにしましょう。通常のWebサーバでは、URLを「/」で終わらせていた場合、自動的に「インデックスファイル」を参照して表示します。「インデックスファイル」としてどのファイル名を使うかはサーバ毎に設定できますが、通常index.htmlとかindex.phpとかに設定されていると思います。
仮にサーバの設定が変更になり、「インデックスファイル名」がindex.php から index.php7 になったらどうなるでしょうか?
既存のリンクすべてを書き換えなければならなくなってしまいます。同様なことはOSやサーバを乗り換えた時に起こりがち。したがって、極力インデックスファイル名は省略するようにしておいたほうが、長期運用には有利です。