簡体字中国語の記事を繁体字中国語に一括変換

ウェブサイト、多言語マニュアル、入力メソッドなどの多言語サポートにおいて、簡体字中国語と繁体字中国語の変換は一般的な要件です。最近、このサイトの一部のユーザーが繁体字中国語を使用していることに気づいたため、繁体字中国語のサポートを提供する必要があります。

Linux オペレーティングシステムで簡体字中国語と繁体字中国語を変換する手順は次のとおりです。

1. opencc をインストールします。

1sudo apt-get install opencc

opencc はオープンソースプロジェクトです。関係者の皆様の献身的な貢献に感謝します。

2. 単一ファイルの変換例:

 1➜ ~ cat simplified.txt
 2静かな夜の想い
 3寝床の前で月の光が明るく輝いている。地面に霜が降りているのだろうか。
 4
 5明るい月を見上げながら、下を向いて故郷を思う。
 6➜ ~ opencc -i simplified.txt -o traditional.txt -c s2t.json
 7➜ ~ cat traditional.txt
 8静かな夜の想い
 9寝床の前で月の光が明るく輝いている。地面に霜が降りているのだろうか。
10
11明るい月を見上げながら、眼下に故郷を想います。

たったこれだけ!「静かな夜の想い」の繁体字中国語への翻訳が完了しました。

パラメータの説明

-i 入力ファイル

-o 出力ファイル

-c 設定ファイル

  • s2t.json 簡体字中国語から繁体字中国語へ
  • t2s.json 繁体字中国語から簡体字中国語へ
  • s2tw.json 簡体字中国語から繁体字中国語(台湾標準)へ
  • tw2s.json 繁体字中国語(台湾標準)から簡体字中国語へ
  • s2hk.json 簡体字中国語から繁体字中国語(香港方言)へ
  • hk2s.json 繁体字中国語(香港方言)から簡体字中国語へ
  • s2twp.json 簡体字中国語から繁体字中国語(台湾標準)へ(台湾語の慣用句を含む) 簡体字中国語から繁体字中国語(台湾標準)へ(台湾語の一般的な語彙への変換を含む)
  • tw2sp.json 繁体字中国語(台湾標準)を簡体字中国語(中国本土の慣用句を含む)に変換
  • t2tw.json 繁体字中国語(OpenCC標準)を台湾標準に変換
  • hk2t.json 繁体字中国語(香港方言)を繁体字中国語に変換
  • t2hk.json 繁体字中国語(OpenCC標準)を香港方言中国語に変換
  • t2jp.json 繁体字中国語文字(旧字体)を新漢字(新字体)に変換
  • jp2t.json 新漢字(新字体)を繁体字中国語文字(旧字体)に変換 日本語(新フォント)を繁体字中国語(OpenCC標準、旧フォント)に変換
  • tw2t.json 繁体字中国語(台湾標準)を繁体字中国語に変換
 1➜ ~ opencc --help
 2
 3Open Chinese Convert (OpenCC) コマンドラインツール
 4作者: Carbo Kuo <byvoid@byvoid.com>
 5バグレポート: http://github.com/BYVoid/OpenCC/issues
 6
 7使用方法:
 8
 9opencc [--noflush <bool>] [-i <file>] [-o <file>] [-c <file>] [--]
10[--version] [-h]
11
12オプション:
13
14--noflush <bool>
15各行のフラッシュを無効化
16
17-i <file>, --input <file>
18<file> から元のテキストを読み込み。
19
20-o <file>, --output <file>
21変換後のテキストを <file> に書き込み。
22
23-c <file>, --config <file>
24設定ファイル
25
26--, --ignore_rest
27このフラグに続く残りのラベル付き引数を無視します。
28
29--version
30バージョン情報を表示して終了します。
31
32-h, --help
33使用方法を表示して終了します。
34
35Open Chinese Convert (OpenCC) コマンドラインツール

3. 複数のファイルを一括変換する

fd コマンド を使用します。Markdown ファイルを一括変換するには、以下の例を参照してください。

1fd -e .md -x opencc -i {} -o {/.}.zh-tw.md -c s2t.json
  • fd -e .md は、.md で終わるファイルを検索します。

  • -x/--exec は、前回の検索結果ごとに追加の操作を実行します。

  • opencc -i {} -o {/.}.zh-tw.md -c s2t.jsonは、各ファイルに対して簡体字中国語/繁体字中国語の変換を実行します。{}{.//` は fd コマンドの構文です (この例では、入力が aaa.md、出力が aaa.zh-tw.md であると想定しています。これはブログシステムの多言語ルールによるものです。読者は以下の手順に従って適宜変更できます)。

  • {}: 検索結果のパス (documents/images/party.jpg) に置き換えられるプレースホルダートークンです。

  • {.}: {} と同じですが、ファイル拡張子がありません (documents/images/party)。

  • {/}: 検索結果のベース名 (party.jpg) に置き換えられるプレースホルダーです。

  • {///: 検出されたパスの親 (documents/images)。

  • {/.}: 拡張子を除いたベース名 (party)。

ファイルを変換するには、正しい検索ルールと一致ルールを記述し、目的のファイル名を出力するだけです。openccfdコマンドを使用して、数千の記事を簡体字中国語から繁体字中国語に10分強で変換できました。様々な中国語の文字スタイル間の変換も簡単で、便利で使いやすいです。

最終更新日: Wednesday, October 29, 2025

このシリーズの投稿:

翻訳: