目次
さて、ここまでで「音階」と「調」について理解しました。ここからメロディ、コード、リズムの各論に進んでいきたいところですが、実はそれよりも前に知っておくべきもっと根本的な内容があって、それは音色についてです。
ピアノとギターの音色が異なることは誰にでも分かります。でももっと具体的に、音響学的に言うと一体何が異なっているのでしょうか? これは音楽制作におけるかなり根本的な知識となるので、各チャプターに進んでいくよりも前にこの話をしておきたいと思います。
1. 周波数
まず音色を論じるうえでの前提となる、周波数Frequencyについて、中学理科で勉強したような内容を軽くふりかえらせてください。
音とは、元を辿れば空気のふるえ。空気の振動の波が耳の鼓膜へ、さらにその奥へと伝わって知覚されたものが音です。周波数は、その音波が1秒に何周ぶん波うつかを測ったもので、ヘルツ(Hz)という単位で表します。
上の図なら、1秒に8サイクルしているから、8Hzです。音楽的に言うと周波数は「ピッチ」に直結していて、周波数が高いほど“高い音”として聞こえて、逆もまた然り。例えばある音よりも1オクターブ高いピッチの音を鳴らしたら、周波数は2倍になるという関係式があります。
人間が聴くことのできる周波数はおよそ20~20000Hzと言われていて2、雷鳴のような“重低音”は低周波数の音、鳥のさえずりのような甲高い音は高周波数寄りの音が多く出ています。
- 雷の音は低周波数が多め
- 鳥の声は高周波数が多め
周波数が高いほど、音は高く聞こえる。それから音の波の振れ幅(振幅)が大きいほど、音は大きく感じられる。これは中学理科で習うことですね。
イコライザー
音楽においては、たとえばベースやバスドラムは低音をメインで担当し、ボーカルなどは中くらいの音域、シンバルのようなシャンシャンした音は高音域…といった感じで、たいていはローからハイまで全ての周波数帯を活用します。
そして楽器ごとに周波数帯域が分かれているという性質を利用して、Spotifyなどの音楽再生アプリではイコライザー(EQ)という装置で楽曲の聴こえ方を微調整することもできますね。

ヨコ軸が周波数(右にいくほど高い)、タテ軸が音量(上にするほど大きい)という見方になっています。
ベースを強調したければ低音域を上げるし、ボーカルをよく聴きたかったら中音域を上げる……といった具合です。「低音域、中音域、高音域」という言葉は、もはや専門用語というより日常的な語彙になっているかと思います。
スペクトラム・アナライザー
そして、楽曲の中で具体的にどんな周波数帯が鳴っているかについては、スペクトラム・アナライザーSpectrum Analyzer、略して「スペアナ」という機器を使って計測が可能です。スペアナは、①どの周波数帯が ②どれくらいの強さで 鳴っているかをEQのようにヨコ軸・タテ軸のグラフにして表示してくれるものです。
こちらは実際にミニマルな電子音楽を分析しているようす。この曲の分析結果としては、低音域は60Hzあたりに、高音域は10k(=10000)Hzにピーク(尖った山)が来ていることが分かります。中音域は弱めで、「カーン」という音が鳴った時だけピークが現れます。こうして音楽に含まれている周波数を視覚的にチェックできるんですね。
このような周波数の分布図のことを、音響のスペクトラムSpectrumと呼びます3。私たちは、幅広く分布した周波数を摂取して音楽を楽しんでいる。これがまず今回のお話のスタート地点です。
チューナー
とはいえ、周波数はあくまでピッチであって、音色とは違います。その証拠に、同じ高さの音を鳴らしたって、楽器が異なれば音色はもちろん異なります。
こちらはいくつかの楽器のピッチをチューナーで検出している動画。周波数はみんな揃って220Hzですが、その音色はそれぞれ異なります。じゃあ音色を決定しているものは何なのでしょうか……?
2. 音の三要素
その答えとなるのが、波形Waveformです。さっきはウネウネした形の波()を例にとりましたが、この波の形というのが無数に考えられるわけです。「波形が、音色を決める」。このことが分かりやすいのが、人工的に音色を加工して作る電子楽器、シンセサイザーです。
古典的なシンセサイザーでは、スイッチやノブなどで音波の形を選んで、それを元に色々な音色を生み出していきます。特に代表的な波形が5つあるので、実際に波形を見比べながら聴いてみましょうッ
左の正弦波(サイン波)から右のホワイトノイズまで、順に鳴らしました。なんとなくですが、波の形がトゲトゲギザギザしてくると、サウンドとしてもギラギラと開放的な音色になっていきますね。波の形が異なれば、あなたの鼓膜の揺れ方が変わる。それが、脳の中では“音色の違い”として認識されるわけです。
というわけで、周波数はピッチとなり、振幅は音の大きさとなり、波形は音色となる。これがいわば、物理の世界と音楽の世界を繋ぐ関係図です。
音の大きさ、高さ、音色。この3つは、「音の三要素」とも呼ばれています。理科の授業では周波数と振幅は教えても、音色だけは音楽的な話だからすっ飛ばしちゃうんですね。それをここで補う形になりました。
3. 周波数成分
さて、さっき「波の形がトゲトゲしたら音もギラギラしがち」なんて話がありましたが、しかしちょっと説明がザックリすぎますよね。もう少しきちんと、音色の特性を数値的に把握したいという気持ちが当然わいてきます。
そこで登場するのが、先ほどのスペアナです。スペアナは楽曲全体の分析だけでなく、たった1音だけでも、そのサウンドの周波数の分布を調べることができます。たとえばベースギターの弦をはじいて鳴らした重低音を、アナライザーに通してみます。すると……
こんな感じになりました。と、ここでさっそく重要な発見があります。確かに“重低音”を司る200Hz以下あたりの周波数帯が強く反応している一方で、それよりも明らかに高い周波数までの鳴りが検知されているのです!! 弦を弾いた瞬間は10k(=10000)Hz以上まで検出されているし、その後も2k~3kHzくらいまでが反応し続けています。
これはつまり、こういうことです。一見“重低音”と言われるベースの音でも、実はその中には鳥のさえずりと同じような高音域のサウンドも微弱に含まれている。それをこのスペアナは教えてくれているのです。
実はチューナーが検出するのはあくまでもこのうち一番低い周波数のピーク(尖った山のところ)だけで、今回だと55Hz辺りになります。
私たちが音を聴くとき、このメインのピーク周波数を“ピッチ”として認識します。一方で楽器の音にはそれ以外の周波数もたくさん含まれていて、それが「こもった音色」や「ギラギラした音色」といった音色の印象を決定づけているのです!このように、音が含んでいるさまざまな周波数群を、周波数成分Frequency Componentsといいます4。
少しフランクに言うと、これは食品の原材料に似たようなところがあります。ケチャップを食べたときに我々が主として検知するのはトマトの味ですが、実は塩やお酢やタマネギなども含まれていて、そういうのが全部合わさって「ケチャップの味」が構築されている。ケチャップにタマネギが入っているなんて、普段はあまり意識しないですよね。楽器の音も同様で、我々は主の周波数をピッチとして認識する一方で、周波数成分の混ざり合ったものを音色として味わっているのです。
というわけで、音色が異なるとはどういうことか。ある視点から答えると、それは波形が異なっているということ。別の視点から答えると、それは周波数成分が異なっているということ。これは同じ現象を異なる視点で見たものであって、「波形」と「周波数成分」はペア関係にあり、片方が分かればもう片方も分かる関係になっています。