AWS/RDS のリードレプリカは障害対策だけではなかった

　AWSのRDSには、リードキャパシティという機能があります。更新用データベース（マスター）からレプリカつまり、データベースのコピーを作ってしまう機能です。

　更新用データベース（マスター）を更新すると、自動的にリードレプリカ側にその更新が反映されるものです。
データベースのコピーと言われると、障害対策用にバックアップとして、取っておくというイメージが強いと思います。

　特徴的なのは、そのリードレプリカが、普通にデータベースを読めてしまうことです。読むことができるレプリカなのでリードレプリカなのでしょう。

　そうすると、更新用のデータベースと読み込み用のデータベースが用意されることになります。プログラム側で、更新時用のデータベースの接続と、読み込み用のデータベースの接続を分けて管理してあげれば、すべての接続を１つの更新用のデータベースに接続するよりも、負荷の分散ができるようになることになります。

　更新用データベース（マスター）を更新すると、自動的にリードレプリカ側にその更新が反映されるといっても、ちょっとラグがある場合があります。更新するデータ量が多く、同期するのに時間がかかれば仕方のないことかもしれません。人間感覚てきには“すぐに”、プログラム感覚的には“少ししたら”ぐらいといった、これは経験的な感覚です。

　なので、書き込みに関わる読み込みを含め、書き込み用データベースへの接続にまかせ、読み込みしか関係ない場合は、リードレプリカに接続して、データベースアクセスを分散させたりしています。

　リードレプリカは複数作成することができます。マスター１つに対しいて、２つのリードレプリカを作るといったものです。マスターを更新すると、両方のリードレプリカが更新されます。RDBのエンドポイントは、それぞれに発行されます。リードレプリカが２つであれば、マスター１つとリードレプリカ２つで３つ作成されることになります。

　リードレプリカそれぞれにエンドポイントがあると、どちらかのエンドポイントを指定してしまうと、接続がその１つのリードレプリカにしかアクセスが行きません。そこでPROXYを使って接続を分散させます。今回は、haproxyを使いました。