UTF-8(Unicode Encoding Forms 8)とは、各文字を1~4バイトの可変長で表現する、Unicodeの符号化方式のひとつです。Unicodeは世界中ほぼすべての文字を含む文字コード規格であり、コンピュータでテキストをエンコードするための変換方式として活用されてきました。なお、UTF-8はExcelで扱うこともでき、CSVファイルをUTF-8でエンコーディングできます。

今回は、ExcelでUTF-8を扱う方法を解説します。エンコーディングする設定方法や活用法にも触れるのでご参考ください。

チャット一括管理アプリ「OneChat」が今なら初月無料!!

OneChatのダウンロードはこちらから

ExcelでUTF-8を使用するメリット

excel utf-8

まずは、ExcelでUTF-8を使用するメリットを解説します。なぜ通常通りExcelでデータ作成・保存するだけでは不十分なシーンがあるのか、理解しておきましょう。

文字化けの防止

UTF-8は世界中ほぼ全ての言語・文字をエンコーディングできる手法であり、異なる言語で書かれたできストデータを含むCSVファイルであっても文字化けすることがありません。反対に、UTF-8でエンコーディングしなかった場合や他のエンコーディング法を試した場合、特に英語以外の言語を含んでいるときは相手がデータを開いたときに文字化けしやすいので注意しましょう。

「データを閲覧できない・使えない」「何度もデータをやり取りしながら試行錯誤するのが面倒」というときは、最初からUTF-8でエンコーディングしておくのがおすすめです。

関連記事:IFS関数活用術!複雑条件も簡単に攻略する方法

多言語対応の強化

UTF-8でのエンコーディングは文字化け防止になるだけでなく、多言語対応の強化にもつながります。データの作成者と閲覧者の使用言語が異なる場合でも、作成者の入力した言語で正確にテキスト表示されるため、意図の異なる自動翻訳や文字の崩れが起きません。特殊文字や記号もそのままエンコードされるので、科学技術文書や金融データなど特殊文字をよく使う業種でも安心です。

データ互換性の向上

UTF-8はオープンなエンコーディング手法であるため、多くのプラットフォームやアプリケーションで互換性があります。パソコンで作成したExcelデータをUTF-8でエンコーディングし、その後スマートフォンやタブレットのExcelアプリで開くなど、媒体を選ばない手法として注目されるようになりました。同様に、他のデータベースやソフトウェアにエクスポートしたり、逆に他のソフトウェアからデータをインポートしたりすることも可能です。

異なるユーザー間でのデータ共有もしやすくなるので、互換性や正確性を保ちながら共有したいときに活用してみましょう。

ExcelでUTF-8を設定する方法

excel utf-8

【1】UTF-8を設定したいExcelファイルを開き、「ファイル」→「名前を付けて保存」をクリックします。

excel utf-8

【2】「名前を付けて保存」ダイアログから「ファイルの種類」プルダウンを開き、「CSV UTF-8(コンマ区切り)」を選択します。今回はExcel2021で実行していますが、Excel2016以前のバージョンでは更新プログラムを適用しないと「CSV UTF-8(コンマ区切り)」は表示されないので注意しましょう。

excel utf-8

【3】メモ帳アプリなどUTF-8に対応したテキストエディタで開くことで、データを確認できます。UTF-8で保存されているため、「髙」(はしご高)などの環境依存文字もそのまま保存できます。UTF-8以外の場合、テキストエディタによっては異体字がJIS2004の字形に変わり、次の文字との間に「??」や「□」が挿入されることがあるため注意が必要です。

ExcelでCSV UTF-8ファイルを正しく開く方法

excel utf-8

【1】Excelを開き、「データ」タブ内にある「データの取得」→「ファイルから」→「テキストまたはCSVから」を選択します。開きたいファイルがExcelであればExcelを、XMLであればXMLを選択しましょう。

excel utf-8

【2】開くファイルのプレビュー画面が開きます。問題なければ「読み込み」をクリックします。

excel utf-8

【3】UTF-8でエンコーディングする前の形式で表示されます。

よくある質問

excel utf-8

ExcelにおけるUTF-8に関して「よくある質問」を紹介します。

CSVファイルとは?

CSVファイル(Comma-Separated Valuesファイル)はテキストベースのファイル形式であり、データをコンマ(,)で区切って記録することが特徴です。Excelやデータベースソフトウェアでの活用が多く、データの交換・保存・共有に適しています。

ExcelファイルではなくCSVファイルで保存するメリットは、以下の通りです。

  1. シンプルなテキスト形式なのでデータの取り扱いが容易
  2. 閲覧と編集が容易でデータ処理に最適
  3. 異なるアプリケーション間でも十分な互換性がある
  4. 行をレコード、列をフィールドで表すわかりやすい構造
  5. 別のプログラムやシステムと連携しやすい

UTF-8でエンコーディングする場合、Excelでまとめたデータを別のソフトウェアにインポートするなど複数のプラットフォームを仲介することが多いです。例えば人事情報を人材管理システムにインポートしたり、反対にシステムからエクスポートしたデータを使って人事評価に活用したりすることがあります。そのため、大量のデータをシンプルかつ互換性のある形で保存できるCSVファイルがよく利用されており、かつ多言語対応や文字化け予防を意識する方であればCSVファイル形式でのエンコーディングがおすすめです。

データの再エンコーディング方法は?

データを再エンコーディングしたいときも、本記事で紹介した方法が使えます。UTF-8を設定したいExcelファイルを開き、「ファイル」→「名前を付けて保存」をクリックします。「名前を付けて保存」ダイアログから「ファイルの種類」プルダウンを開き、「CSV UTF-8(コンマ区切り)」を選択すれば完了です。

互換性のあるアプリケーションは?

UTF-8は幅広くサポートされており、多くのアプリケーションやシステムと互換性があります。以下では代表的なアプリケーションを紹介します。

【オフィススイート】

  • Microsoft Office(Word・Excel・PowerPointなど)
  • Google Docs・Google Sheets・Google Slides
  • LibreOffice

【データベース】

  • MySQL
  • PostgreSQL
  • MongoDB

【プログラミング言語】

  • Python
  • JavaScript
  • Java
  • Ruby
  • PHP
  • C#
  • Go

【Webブラウザ】

  • Google Chrome
  • Mozilla Firefox
  • Microsoft Edge
  • Safari

【操作システム】

  • Windows
  • macOS
  • Linux

その他、チャットツール「Slack」やドキュメント共有ストレージ「Dropbox」などとも互換性があります。UTF-8の普及により、主要なソフトウェアやシステムのほとんどがUTF-8に対応できるようになっていることからも、汎用性の高い便利な活用法となっています。

まとめ

UTF-8はテキストデータをエンコーディング(符号化)する手法のひとつであり、多言語対応・文字化け防止・高い互換性など多くのメリットがあります。データの相互運用や国際化にも貢献しているため、データ共有時のストレスを解消したいときは積極的に活用してみましょう。

Excel utf-8に関する重要用語

用語説明
UTF-8「Unicode Encoding Forms 8」の略称。各文字を1~4バイトの可変長で表現する、Unicodeの符号化方式。
エンコーディングデータを一定の規則に従って目的の情報に変換すること。「符号化」とも呼ぶ。
CSVファイル「Comma-Separated Valuesファイル」の略称。テキストベースのファイル形式であり、データをコンマ(,)で区切って記録することが特徴。