倍音についてちゃんと知りたくなった人がたどり着くための記事

音楽をやっていると、「倍音が豊かで〜」とか「倍音成分が〜」みたいな話がよく出てくる。よく出てくるのだけれど、じゃあ倍音ってなんなの、と聞かれてきちんと答えられるひとはそう多くないような気がする。わたし自身、ベーシストであり、かつレコーディングエンジニアでもあるので、倍音がどうだとか周波数特性がどうだとかいう話には日常的に触れているのだけれど、このあたりの話を「ちゃんと」理解するためにはどうしても避けて通れない概念があると思っていて、それがフーリエ合成とフーリエ変換である(あ〜まってブラウザバックしないで)。フーリエ変換、名前だけ聞くとなんだか難しそうだが、音楽に関わるひとにとってこれを「なんとなく」でも理解しておくことの価値はかなり大きいと思う。というわけで、今日はフーリエ変換の話をして、そこから「音色とはなにか」をちゃんと定量的に語れるようになるところまでいきたい。

すべての波形はサイン波の足し算でできている

まず大前提として知っておいてほしいのが、全ての有限の範囲の波形は、原理的にはサイン波の足し算で表すことができる、という事実だ。サイン波というのは、高校で習ったあの f(x)=sin(x) のあれである。

まって!! 帰らないで!!! 高校数学0点でもわかるように書くから! あれのグラフってなんかすごくなめらかな波になりますよね。シンセサイザーをさわったことがあるひとなら、オシレーターの波形選択で「サイン波」を選んだことがあるかもしれない。あのなめらかな「ぽー」という音の波は、f(x)=sin(x)のグラフの形をしている。サイン波は、音楽においては「純音」とも呼ばれる、もっともシンプルな波形である。

-2π 0 π 1 -1 x y f(x) = sin(x)

で、この節の最初の段落では、この「サイン波を足し合わせるだけで、全ての波形が表現できる」ということを言ったわけだ。「あんなシンプルな波を足し合わせるだけで、この世のあらゆる波形が作れるの?」と思うかもしれないが、作れるのだ。これはべつにわたしの主張ではなくて、数学的に証明された事実である。フーリエさんは、とても、すごい。

具体的な例を見てみるのがいちばんわかりやすいと思うので、矩形波(くけいは)を例にとってみる。矩形波というのはその名の通り四角い波形で、「ぽー」ではなく「ビー」みたいな、ちょっとファミコンっぽいやつだ。じつはこの矩形波、サイン波を足し合わせることで作ることができる。

やりかたはこうだ。まず基本となるサイン波を用意する。これに対して、3倍の周波数のサイン波を振幅1/3にして足す。さらに5倍の周波数のサイン波を振幅1/5にして足す。7倍の周波数を振幅1/7で足す。つまり奇数倍の周波数のサイン波を、その逆数の振幅で足していくわけだ。すると、足す成分を増やせば増やすほど、波形はどんどん矩形波に近づいていく。3倍音までだとまだ全然なめらかだが、9倍音くらいまで足すとだいぶ四角くなってくるし、99倍音まで足せばほぼ完全に矩形波である。無限に足せば完全な矩形波になる。

π/2 π 3π/2 0 1 -1 x y sin(x) のみ(1倍音) 3倍音まで 9倍音まで 理想的な矩形波 99倍音まで

ね? 矩形波がサイン波の足し算でできていることがわかったでしょう? この考え方をフーリエ合成と呼ぶ。あらゆる波形は、サイン波の足し算で表現できるのだ。

フーリエ合成とフーリエ変換

さて、いまやったように、サイン波を足し合わせて複雑な波形を作る操作のことを「フーリエ合成」という。で、その逆方向の操作、つまり、ある波形を「どの周波数のサイン波がどれくらい含まれているか」に分解する操作のことを「フーリエ変換(フーリエ解析)」という。

フーリエ合成が「サイン波を足して波形を作る」なら、フーリエ変換は「波形からサイン波を取り出す」だ。方向が逆なだけで、やっていることの本質は同じである。

フーリエ変換をすると、ある有限の範囲の波形について、「この周波数の成分がどれくらい含まれていて、この周波数の成分がどれくらい含まれていて……」ということがわかる。これはめちゃくちゃ強力な分析手法で、音響に限らずありとあらゆる信号処理の基盤になっている技術だ。

で、このフーリエ変換の結果を可視化したもの、つまり横軸に周波数、縦軸にその周波数成分のレベルをとったグラフを表示してくれる装置が「スペクトラムアナライザー」(通称スペアナ)である。DAWを使っているひとなら見たことがあるだろう。あのギザギザしたグラフのやつだ。スペアナが表示しているものの正体は、フーリエ変換の結果なのだ。

基音と倍音

さて、ここからがようやく本題というか、音楽をやるひとにとって実用的な話になる。

わかりやすくするために、前回のスペアナの結果をひとつ持ってこよう:

スペアナにある音を入力すると、いくつかのピーク(山)が表示される。このうち、もっとも低い周波数に位置するピークが「基音」だ。基音とは、その音の「聴感上の高さ」を表す周波数であり、倍音列の中で最も低い周波数成分のことである。たとえばベースの3弦開放のAの音をスペアナにかけると、55Hzのところにまずピークが立つ。この55Hzが基音だ。

そして、基音以外にもピークが立っているのが見えるはずで、これがいわゆる「倍音成分」である。たとえば基音に対して2倍の周波数、つまり110Hzのところにピークが出ていれば、それが「2倍音」だ。3倍の165Hzなら「3倍音」。この周波数がたくさん出ていれば、それは「2倍音を豊富に含む」とか「3倍音が強い」と言うわけだ。楽器やオーディオの世界でよく聞く「倍音が豊かで〜」というのは、つまりこのことを言っている。

さきほどのフーリエ合成の考え方からいうと、基音の周波数のサイン波と、各倍音の周波数のサイン波を、それぞれ適切な振幅で足し合わせると、元の音が再構成できる、ということでもある。これはさっきの矩形波の例と全く同じ理屈だ。矩形波が奇数倍音のサイン波の足し算で作れたように、あらゆる楽器の音も、基音と倍音のサイン波の足し算として理解できる。

「音色」の正体

さて、ここで大事なことを言う。「音色」とは何か。音色とは、おおまかに言えば、基音に対して何倍音がどれだけ含まれているかによって大きく決定されるものだ。

同じA(55Hz)の音を鳴らしても、ベースとピアノとサックスでは全く違う音がする。聴感上の音の高さは同じAなのに、「音色」が違う。この違いの正体が、倍音構成の違いなのだ。ベースのAとピアノのAでは、2倍音、3倍音、4倍音……の含まれ方がそれぞれ異なっていて、それが「ベースの音」「ピアノの音」という音色の違いとして聴こえている。偶数倍音が多く含まれる音は暖かく丸い印象になり、奇数倍音が多く含まれる音は鋭くはっきりした印象になる、ということが広く知られている。

前回の記事でアルダーローズのベースとアッシュメイプルのベースの倍音成分を比較したが、あの記事でやっていたことの背景にあるのがまさにこの考え方である。「音色が違う」ことを定量的に語るためには、「基音に対して各倍音がどのような比率で含まれているか」を調べればよい。スペアナの出番というわけだ。

時間軸で変化する音色

ところで、ここまでの話は「ある瞬間の波形」についての話だった。しかし、実際の楽器の音というのは、もっと動的なものだ。

実際の楽器の場合、「何倍音がどれくらい含まれるか」は時間軸で変化する。たとえばベースの弦をはじいた瞬間(アタック)には高次の倍音成分がバリっと出て、そこからサステイン(音が伸びている部分)に移行するにつれて高次の倍音成分が減衰していく。つまり、アタックの瞬間とサステインの間でも音色は変化している。言い換えれば、周波数成分は時間とともに変化しているわけだ。

だからこそ、楽器の音というのは「静的なスペクトラム」だけでは完全には記述できなくて、「時間軸に沿ってスペクトラムがどう変化するか」まで見ないと本当の意味で「音色を理解した」とは言えない。前回の記事の最後で「アタック部分だけスペアナにかけてみる、サステイン部分だけスペアナにかけてみる、などもできると面白いかもしれない」と書いたのはまさにこのことで、音色の「時間的な変化」を追いかけることは、次なる研究課題としてかなり面白いと思っている(やるとは言っていない)。

まとめ

というわけで、フーリエ変換から始まって音色の話までたどり着いた。まとめると、あらゆる波形はサイン波の足し算で表現でき(フーリエ合成)、逆に波形をサイン波に分解することもでき(フーリエ変換)、その結果を可視化するのがスペクトラムアナライザーで、音色とは基音に対する倍音の含まれ方で決まる、ということだ。

こういう原理を知っておくと、楽器やオーディオの世界にはびこるオカルトに対して「それ、スペアナで見たらどうなってるの?」という態度がとれるようになる。べつにオカルトを全否定したいわけではなくて、定量的に語れることは定量的に語ったほうが、議論の土台がしっかりするでしょう、というだけの話である。「このベースは倍音が豊かで〜」と言うのと、「このベースは基音に対して2倍音がひっこみがち、3倍音がでがちで〜」と言うのでは、後者のほうが圧倒的に情報量が多いし追試や検証や反証が可能でしょう? 追試や検証や反証はできたほうがよいんですよ。基本的にはエンジニアの気持ちとしては。

あと、まあ「オカルトは解き明かされるべきだよね」の立場からすると、「倍音が豊かなスピーカー」とかはたいぶへんなことを言っている。ということが見えてきませんか? つまり、入力された信号に対して、倍音が足されている? 音楽、フレーズが含む基音はひとつではない。縦にはハーモニーがあり、これは「同時に複数の基音が鳴っている」ということだし、横にはメロディーがあり、これは「時間軸でみたら複数の基音が鳴っている」ということになる。ここに対して、「倍音が豊か」とはつまりなにを言っているんだ? 「このスピーカーは倍音が豊か」と言っている人間はそれを理解した上で言っているのか? という「意地悪な見方」ができてきてしまうわけですね。あと、「倍音が豊かならそれでいいの?」「そんな単純な話なの?」という話も出てきますな。しかし意地悪であろうとなんだろうと、再現性の前にそれは関係ない。もういい大人なので、たとえば目の前のひとがそう言うことを言っていてもいちいち論破して回らないけれど、きちんとした理解に基づいて音色について話したいし検討したい、とは思っている。

ここで「歪み、あるいは増幅時のクリッピングと倍音」の関係について考えていくと結構おもしろいんだけど、それはトピックが散漫になってしまうので今回の記事からはスコープ外とする。

ミュージシャン、MIXエンジニアはどうすべきか

で、肝心のこういったことを知る、学ぶことが、演奏やミックスにとってどんな効果があるか、というとですね、これはまあちょっと言いにくいけど、明確に「ない」んですね。この読んだ時間返せよって感じかもしれないけど、まじで「効果はない」です。いや、厳密に言うと、「いい音がでたとき」になぜそういう音が出せたのかを分析できれば、もしかすると、再現性高くその音が出せるかもしれない。けど、そんなことよりも、ただ、世界のひとつの現象をより高い解像度で見る目を身につけることができるようになる。そういう目で音楽を聴いたり音楽をやったりするのは、かなり贅沢な音楽の楽しみ方のひとつだと思うんだよね。エンジニアとしてのわたしは、この「世界を見る目の分解能をあげる」ってことがそもそも「ただの楽しいこと」だとおもってやってるところがある。基礎研究みたいなもん。で、ミュージシャンとしてのぼくって、音楽って世界の神秘だと思っていて、その世界の神秘の「ひみつ」の一端を解き明かしていくなんて、とてもロマンチックで素敵な遊びだと思っている。つまり、なんだ、役立つからやってんじゃなくて、おもしれーからやってんだな。いいんです。大人の自由研究なので、それで。

アッシュメイプルのベースとアルダーローズのベースの倍音成分を調べてみる

楽器やオーディオの世界では、さまざまなオカルトめいた言説が幅を利かせている。曰く、電源ケーブルを変えると音が変わる、だとか、挙げ句の果てにデジタル記録メディアを変えると音が変わるだとか。わたしはこの手のオカルト全てが「嘘だ」と思っているわけではなくて、たとえばエレキベースにおいて木材によって音が変わる、というのは経験的にも「そうだろうね」と思っている。ところで、ジャズベースタイプと言えば60'sタイプと70'sタイプに大別されると思うが、まあおおまかに、60'sタイプはアルダーボディ、ローズウッド指板、70'sタイプはメイプルボディ、メイプル指板というスペックが「王道」であろう。実は違いは木材だけではなく、70'sのものはリアピックアップの位置がわずかにブリッジ側に近くなっている、というのも定番の違いだ。

さて、なぜか(?)わたしの手元には、今たまたま(?)アトリエZのジャズベースタイプであるM#245と、セイモアダンカントラディショナルシリーズのジャズベースタイプが存在する。ジャズベースタイプを2本所有するという罪を犯した記憶は都合よく忘れているので、「なぜか、たまたま」手元にあるのだ。アトリエZ M#245は木材としてはアッシュメイプルで、70'sスタイルに近いものだ。しかし、その「いかにも70'sジャズベーススタイル」なルックスとサウンドで勘違いされがちだが、じつはピックアップの位置は60'sスタイルを踏襲している。セイモアダンカンといえばピックアップメーカーとして有名だが、一時期ESPのOEMで楽器本体を販売していたこともあるらしく、私の手元にあるものはアルダーボディ、ローズウッド指板のものである。ピックアップレイアウトは60'sレイアウトである。

さて、ここで「オカルト」の話になるが、楽器の世界やオーディオの世界でどうしても「オカルト」がはびこってしまうのには、「完全に条件を揃えた比較」というのがたいへん難しい、という理由がたぶんあると思う。つまり、私の手元にあるこの2本のジャズベースタイプについても、どちらもジャズベースタイプ、ピックアップレイアウトが60's、とくれば「木材以外は同じ条件じゃん」と思ってしまいそうだが、そもそもインストールされているピックアップが異なる。ブリッジも異なる(ダンカンのほうはスパイラルブリッジ、アトリエのほうはバダススタイルのものだ)。ピックアップと弦の距離だとかフレットまでの弦の距離だとか、セッティングだって異なる。まあセッティングについては定規やフレットすり合わせで「極限まで揃える」ということをしようと思えばできないことはないが、個体が違う以上「完全に同じ」にはできない。演奏だって、弾き比べる際に「全く同じ演奏」をすることはできない。そういうわけで、厳密な比較や再現性を用意することがそもそも大変に難しいのが楽器やオーディオの世界である。

という言い訳をした上で、やはり、アルダーローズのベースとアッシュメイプルのベースには明確にキャラクターの違いがあると感じる。そこで、あくまで「一例」として、このキャラクターの違いをきちんと定量化して言語化してみよう、というのがこの記事である。

ところで、こういうサウンド比較をしている動画や記事というのは星の数ほどあるのだけれど、わたしはかねてからそれらの記事や動画への不満があった。それは、そのほとんどが聴感上の話しかしていないか、「フレーズを弾いたものに対してスペアナを刺したものを比べる」ものであることだ。まあ、楽器や音楽は聴感上のものが全てだろ、と言われればそうなんだけれど、わたしは楽器奏者であると同時にエンジニアでもあるので、それではちょっと気持ちがわるい、気分のすわりがわるいのだ。ちゃんと、定量化して、再現性のあることばで語りたい。「じゃあスペアナを比べる動画や記事でいいじゃん」という話もあるかもしれないが、これがまた難しいところで、前述の通り多くの検証では「フレーズを弾いたもの」に対してスペアナをかけている。じつは、フレーズを弾いたものに対してスペアナを刺しても、倍音がどのように出ているか、というのはわかりにくい。ハイがどれくらい出ていて、ローがどれくらい出ていて、ということはわかるが、フレーズにはいろいろな音の高さが混じってしまうので、基音に対して倍音がどのように出ているかがわかりづらくなってしまうわけだ。「音色」というのは、原理的には基音に対して倍音がどのように出ているかで決定されるので、音色を定量的に語るためには、フレーズを弾いたものをスペアナにかけるのではなくて、「単音」をスペアナにかけたほうが都合がよいはずである。

そのような発想をもとに、今回わたしは、「3弦解放A」「4弦5フレットA」をそれぞれBPM120において全音符ふたつ分伸ばしたものを、ふたつのベースで録音して、分析してみることにした。アトリエZのほうはアクティブベースなので、条件を揃えるためにアクティブサーキットはoffにしてある。直感的には、解放した状態で鳴らした音と押弦した状態で鳴らした音では、押弦した状態で鳴らしたもののほうが指板の影響を受けそうな気がする。演奏によるブレをなるべく排除するため、それぞれ4回ずつ録音して、傾向を調べることとする。というわけで、長い前段はここまで。では結果へGo。

結果

解放での比較

まず、アッシュメイプルのほうの4回の演奏(というかボーン、と一音鳴らしただけだけど……)をスペアナにかけたものを掲載する

1回目:

2回目:

3回目:

4回目:

続いて、アルダーローズのほう

1回目:

2回目:

3回目:

4回目:

押弦状態での比較

アッシュメイプル

1回目:

2回目:

3回目:

4回目:

アルダーローズ;

1回目:

2回目:

3回目:

4回目:

結果の考察

まず、全ての波形において、きちんと「ギザギザ」が出ていることを確認したい。3弦解放Aのピッチは55hzである。スペアナを見ると、一番低音側の山はまさに55hzのところにあり、これが基音であることがわかる。そこに対して、2倍音の110hz、3倍音の165hz、4倍音の220hz、5倍音の275hz、というように綺麗に整数倍音にピークが並んでいる。

では、これらのピーク部分について、それぞれ詳しくみていくこととする。

まずは解放弦同士を比べてみる。

それぞれにおいて、2倍音と3倍音のピークを比べてみると面白いことがわかってくる。 アッシュメイプルの2倍音(110hz)と3倍音(165hz)のピークをみると、だいたい同程度に出ている傾向があることが見て取れる。一方、アルダーローズのほうの2倍音と3倍音を比べて見ると、明らかに2倍音のほうが大きく出ている(というか、3倍音が引っ込んでいる)。3倍音と4倍音に注目しても同じようなことが言えて、アルダーローズは3倍音が引っ込んでいる結果3倍音よりも4倍音のほうがよく出ている傾向にある。一方アッシュメイプルは3倍音のほうが出ている傾向にある。

次に押弦同士で比べてみる。

2倍音と3倍音を比べてみると、木材に関わらずすべての波形で3倍音のほうが引っ込んでいる。しかし、引っ込み方の比率をみると、やはりアルダーローズのほうが3倍音が2倍音のレベル比でみたときに、より小さいレベルになっているように見える。3倍音と4倍音の比率を見てみても、はやりアッシュメイプルのほうが3倍音が出やすい傾向があるようだ。

これは、世間一般で言われている「アッシュメイプルは鋭い音、アルダーローズは暖かい音」という印象と一致する。つまり、アルダーローズのほうが偶数倍音が多く含まれるわけで、偶数倍音が多く含まれる音を一般に人間は暖かい、丸い音と感じるから。

おもしろいのが、この音の傾向の差が、押弦同士よりも解放同士で比べた方が顕著にみられるように見えるところだ。「直感的には押弦したほうが指板の影響を多く受けそうだ」と予想したが、スペアナをみるとその逆に見える。

とりあえず今回はこれくらいの分析でやめておくけれど、もっと上の帯域をじっくり見比べてみるとまた違いが見えてくるかもしれない。スラップ奏法をした場合などはまた違う波形が出てくるだろうし、音色は周波数特性だけで決まるわけではなく、トランジェントがどうなっているか、などにもよるので、まだまだ研究の余地はある。アタック部分だけスペアナにかけてみる、サステイン部分だけスペアナにかけてみる、などもできると面白いかもしれない。(なんか時系列でスペクトラムの変化を可視化するやつあるよね。あれほしいんだけど、なんて名前のやつなの?)とりあえず今日のところは、今回の条件で比べてみたところ、少なくともわたしの手元にある個体に関してはたしかにアルダーローズの個体のほうが世間で言われる「暖かい音がする」という「信仰」と物理現象が一致することがたしかめられた、と言っていいと思う。大人の自由研究はまだまだ続く(かもしれない)。しかし誰が読んで喜ぶんだ? こんな記事。

5年以上ぶりに自分の曲がバンドでリリースされた

本日 2026-02-13 をもって42歳児になりました。自分の誕生日プレゼントにといって突然新しいベースを買ったりと、あい変わらずわけの解らないこと言ってます。花粉症が始まっていますが、薬も効き始め、あい変わらず僕はなんとか大丈夫です。

最近、バンドで新曲を録音していました。完成したのでリリースしましょう、という段になって、メンバーが小粋な気を利かせてくれて、「せっかくならしんぺいさんの誕生日にリリース日を合わせようよ」と提案してくれました。「そりゃいいですね」ということになり、晴れて本日リリースと相成りました。

わたしのやっているバンドは、ギタリスト、鍵盤弾き、ベーシストがそれぞれ曲を書き、自分の曲は自分で歌うというスタイルで活動しているのですが、なんとこのバンドでわたしの曲がリリースされるのは、2020年8月以来らしく、思えばだいぶ過ぎちゃったなという感じです。これには言い訳があって、ギタリストと鍵盤弾きの曲がよすぎるんだよな。レコーディングエンジニアはわたしがやっていて、わたしが彼らの曲のファンなので、どうしても彼らの曲を優先しうちゃうんだよね。なんにせよ、久々の自分の曲のリリースということで、まあ、正直に言えば結構嬉しいもんです。

本作は、『3月の写真』という曲です。学生時代を、路面電車のある街で過ごし、キャンパスの入り口に長いスロープを擁した学部に毎日通っていました(ほんとうに毎日まじめに通っていたかはともかく……)。で、「3月の写真」。ありていに言ってしまえば「卒業ソング」ってやつですよね。42歳が卒業のことを歌うというのはあまりにちょっと「青春病」がすぎるという部分もありますが、自身の卒業や大学生活を「突き放して」歌えるようになるまでに20年間かかっている、ということでもある気がします(42歳……)。

冒頭の路面電車の音は、わざわざ都電荒川線に乗ってフィールドレコーディングしてきました。空気感含めて楽しんでもらえると嬉しいです。卒業というのはたいへんに個人的な体験である、と思っていますが、その個人的な体験がどこか、いろんなひとの普遍的な感情と繋がるといいなと思って作った曲でもあります。

YouTubeならばワンクリックで聞けます。

www.youtube.com

各種音楽配信サービスでも聞けます。お使いのサービスで「3月の写真」と検索してみてください。信号機の写真がジャケットになっているものがそれです。

「よかったよ」という方は、ぜひBandcampで投げ銭しつつご購入いただければ幸いです。Bandcampでもフル尺で聴けます。

triothecmyk.bandcamp.com

リズム練習をClaudeくんにコーチしてもらう

じぶんのベースの演奏を各AIくんに分析させたところ、Claudeが一番定量的な評価をしてくれた。どうやら内部で信号分析のスクリプトを書いて実行していそうだった。これはおもしろいぞ、と思って、以下のプロンプトを入力してみた。

16分音符を基準として、ベースの発音が、ジャストに対してどのくらいズレているのかを分析してみてほしい。「ズレは平均どのくらい(ms、何分音符ズレているか)か」「ツッコミ気味なのか、レイドバック気味なのか」などが可視化されるといいな

結果、かなり詳細に分析してくれて、このタスクにおいては他のAI君たちとClaudeくんは格がちがった。他のAIくんたちはおべっか使うばっかりで役に立たなかったが、Claudeくんはかなり練習や分析の役に立つ。

AIくんによる総評とわたしの感想

分析結果は以下のようになっていた。

完成しました!16分音符グリッドを基準としたタイミング分析です。

主な発見

タイミングのズレ

  • 平均ズレ: +7.1ms(16分音符の約0.093個分)
  • 中央値: +9.9ms(16分音符の約0.129個分)
  • 絶対値の平均: 15.8ms(16分音符の約0.21個分)

演奏スタイル

レイドバック(後ノリ)気味 の演奏です: - レイドバック: 68音符(61.3%)← 多数派 - ジャストタイム: 18音符(16.2%) - ツッコミ気味: 25音符(22.5%)

解釈

この演奏は意図的にビートの後ろで弾くスタイル。ジャズやファンク、R&Bでよく見られる「グルーヴ感」を生み出す手法です。約7msの遅れは、心地よいレイドバック感を作り出しており、機械的でない人間らしいグルーヴを生んでいます。

6つのグラフで: 1. タイミングのズレ(ミリ秒)の時系列 2. タイミングのズレ(16分音符単位)の時系列 3. ズレの分布ヒストグラム 4. タイミング特性の割合 5. 統計的サマリー(箱ひげ図) 6. タイミングの推移トレンド

特に右下のトレンドグラフを見ると、演奏全体を通じて一貫してレイドバック気味であることがわかります。これは非常に安定したグルーヴ感の証拠です!

claude codeが演奏を分析してくれたグラフ。文章にかかれていた内容が可視化されている

これは「絶対値の平均」を出してきたのがかなりいい分析だと思っていて、「ジャストよりも前」と「ジャストより後」が打ち消し合ってずれの平均が低くなったところでそれは「ガタガタの演奏」であるわけだから、絶対値の平均を持ってくるのは気が利いている。

グラフを読み解くと、前後40msのブレに収まっていることがわかる。が、全体がレイドバック気味なときに前に40msというのはかなり「ツッコミすぎ」であり、このあたりは改善の余地がありそうだ。

ちょっとローデータに近すぎるなと思ったので、「解釈しやすい数字と解釈を入れてくれ」としたところ、面白い事実として

  • ジャストからのタイミングのずれの標準偏差が: 17.44msであることが示された。
    • この数値の解釈としては……
      • 人間が音のズレを知覚できる限界約10〜20msちょうど境界ラインらしいのでまあ悪くないラインにいそうだ
      • プロのセッション基準が<10msである、とClaudeくんは主張していて、なるほどまあ感覚的にわからんでもないラインだ。
  • 平均と中央値の差: 2.75ms
  • 意図的なレイドバック(+7.12ms)を一貫して維持
  • 極端なズレ(>30ms): 13.5%
    • セミプロレベル(5-15%)の範囲内

おべっかを使ってセミプロレベルと言ってくれているが、極端なズレ(>30ms)が13%以上あるのはいただけない。

わたしの解釈とネクストアクション

  • リズムフィール、タイム感については全体的には一定安定してるといって良さそうだ。
  • 問題は 極端なズレ(>30ms): 13.5% であろう。演奏の1割以上が、30ms以上ずれているということだ。60fpsで考えて2fというのはけっこう大きい数字だ。これはいただけない。これが改善すると、リズムのずれの標準偏差も小さくなるはずであり、より「安定してレイドバックした演奏」を見につけることができそうだ。

では、どうしたら「極端なずれ」を減らすことができるのか。これはもう単純にフィジカルだと思う。早いパッセージで転ぶ、とかそういう「頭でなってるリズムに体が追いついていない」ということが起こっているのは、フィジカルがついていっていない部分だ。フィジカル練……嫌いなんだけど……これをやらないと一歩上にいけないということを定量的に見せつけられていて、たいへん優秀なコーチであると感じる。あしたから毎日30分基礎練します……。

ところで、これはけっこうすごいのではないか?

よく「〇〇のリズムは魔法で」とか「バックビートに重心が〜」とか言ってるけど、定量的な話はなにもしないオカルトリズムパーソンがインターネットに湧いて出てきては初心者にハラスメントをやっていくが、オカルトリズムパーソンが言っているようなことを、この手法で定量的に研究することが簡単に可能になるのではないか? 今回はスクリプトをClaudeが作ってClaudeが実行したので再現性にやや難があるが、スクリプトを提示させれば再現性も確保できよう。リズムのオカルトをAIが解き明かして、その原理を学習したAIが生成する音楽がよりファンキーで踊れる人間的な演奏のニュアンスを獲得していく、これはけっこう面白い未来だと思う。芸大生あたりが研究しないかな。わたしは音源が1000億再生されて億万長者になったら研究します。

2026年1月音楽活動月報 アジャイルな見積もりと計画づくり - 音楽編

現状確認

2025音楽活動振り返り - 猫型の蓄音機は 1 分間に 45 回にゃあと鳴く で触れた通り、今年は音源のリリースとライブ活動について結構ストレッチな目標を立てている。

2月も中旬になってしまったが、これをきちんとトラッキングしていこうと思う。1月月報として出す。が、毎月出すかはわからない。こういうのはだいたい三日坊主になるもんである。

目標を再度掲載、現状確認をすると……

錦玉もなか

上期

  • ☀️ 音源を2つリリースしたい、と言っていた => レコーディング、mixが終わったのであとはリリース作業をしていくだけ
  • ☀️ 告知も含めてライブを一回したい、と言っていた => 5/10、荻窪アルカフェにてブッキング済み

となっており、なかなか順調に進んでいると言えるのではないか

下期

  • ☀️ 音源をもうひとつリリーししたい、と言っていた => これは5月のライブを終えたらすぐ録れそうなのでいける見込み
  • 🌤️ もういっかいライブをしたい、と言っていた => まだまだ未確定なことが多いが、まあいけんちゃうか、と楽観視している。バンドセットでやりたいという夢を込める場合は☁️くらいまでforecastが下がる

バンド

上期

  • ☁️ 上期に音源を3つリリースしたい。 => 1曲は2/13に出ます!!ぼくの誕生日です! あと1曲はレコーディングが3月になりそう。もう一曲はもしかすると開始が5月にずれ込むんじゃないか?という気がしてきており、本当に上期に3つリリースできるか不安要素は大きい。仕事ならばリカバリ策をなにか考えるべきところだが、趣味なので、間に合わなかったら「2曲しか出ませんでしたね」にしてもまあええやろ。

下期

  • ☀️ 上期にレコーディングが間に合わなかったら一曲あとまわしにしてでもバンドセットでのライブの練習に入ろうという合意形成をバンドでおこなったので、これはあとはやるだけ。

検討

錦玉もなか

  • まあ年明け前に仕込んでいたものが正しくうごき正しく進んでいるので、錦玉もなかの活動についてはmost likelyといった感じの着地である。
  • よかった点は今後の上期の錦玉もなかの活動でやるべきことが固まっている状態を作れたこと。ライブの練習と新曲の練習、それがおわったらレコーディング。この活動が下期のリリースとライブに関わってきそう。
  • いずれにせよこれは「やるだけ」なのであまり不確定要素が多くない。5月のライブの練習とレコーディングの練習が同時に進められるのか、というところだけが若干不安要素か。けどまあいけるでしょう。
  • 下期ライブはバンドセットでやりたいという野望をもっており、これはちょっとストレッチ目標としておいてある。most likelyで読み込めば、下期もアコースティックセットで、ということになるかもしれない。しかしネクストアクションが明確なら人間は前に進んでいけるのと、計画というのは変更するためにある、計画に従うよりも変化への対応を重要視するアジャイル男なのでいまのところはこれでいいのだ。

バンド

  • 「順調に遅れが出ている」という見方が可能そう。2/13に新作がリリースされるのはいいとして(そのときまた宣伝します)、3月に次の曲をレコーディングすることになっているが、これがスタジオ一回でどこまで録れるか、不確実性が高い。「おかわり」となってしまうと、当初の目標だった上期中に3曲出すということはむずかしくなるかもしれない。
  • しかしアジャイル男なので、計画よりも変化に対応することとして、その場合は上期のリリースは2曲に止め、下期のライブのための準備に取り掛かればよいだろう。というわけで☁️としている。
  • そこからライブに向けての準備に集中すれば、ライブの準備不足で大失敗するということにはなりにくいだろう。なぜならわれわれは持ち曲が多いので、「あれとあれとあれならすぐできるな」が多いので、納期(ライブ)に合わせてスコープの調整がしやすいのだ(今回よゆうないから、練習がたくさん必要なこの曲じゃなくてあっちやろうよ、など)。ただし、そのようなセットリストの組み方が果たして顧客最優先主義になっているのかどうかは意見のわかれるところである。

ネクストアクション

  • 計画の見直しはいまのところ必要なし。時間がたって情報が増えてきたらまた見直す時間を作ってよさそう。バンドの音源を3つ出すか2つにするかは2つめの音源の進捗次第とする。
  • あとは日程の決まっているスタジオワークを粛々とやるだけ

最後にひとこと

これがアジャイルな見積もりと計画づくりじゃい!!!! こうやっていかねえとマジで「無限に後ろ倒しされていく目標」とかが生じて音楽活動に継続性がなくなるんだよ〜〜〜。やってることが仕事では!? みたいなところあるけど、楽しいからやる、それだけなんですね。あとまあステークホルダー多くないからそこは楽だわね。仕事だともっとたいへん

大LLM時代、コンピュータはなお「計算機」である

大LLM時代、コンピュータがその名の通り「計算機」であることの重みはますます増しているかもしれない。こう考えた理由はふたつあって、ひとつは、まさに「計算機」であることのポテンシャルを活かしに活かしているのが昨今の大規模言語モデルであるということ。大規模言語モデルは「計算量でぶん殴る」ことで成立している。たぶんだけど、「大インターネット時代」はむしろ「記録できること」「ネットワークを横断して記録がコピーできること(ダウンロード、アップロードとは本質的にデータのコピーである)」がその恩恵を支えていたが、LLMに関してはまさに「計算機であること」がその恩恵を支えている。ここにきて、コンピュータがその名のとおり「計算機」であることが重要なファクターとなっているわけだ。もうひとつの理由は、LLMが容易にカーゴ・カルト化するであろうということ。どれだけ賢く見えても、コンピュータは「計算機」である。だから膨大なテキストはベクトルという計算可能なものに変換する必要があるし、どれだけブラックボックスでもその中でなされているのは「計算」である。この認識はLLMがカーゴ・カルト化することをある程度防いでくれるのではないか。

と、まあ、このような思索は「無為な思索」の類だろう、とも思う。しかし一方でプロンプトを与えらえたわけでもないのにこうやって無為な思索をするのは人間に残された贅沢ではあろう。だし、前段で述べた通りコンピュータはその名の通り「計算機」である、という認識に立てば、こういう「無為な思索」が計算可能であるか、あるとすれば、どのように計算可能になるかを考えることは、問うに値するかもしれない。

2025音楽活動振り返り

2025年Good

バンドセットでのライブ

5月に久々にアコースティックセットではないちゃんとしたバンドセットのライブをやった。BLUE MOODという箱で、音響的にも雰囲気的にもかなり良い箱だったと思う。お客さんにもたくさんきてもらえて、感想も上々という感じで、半年くらい準備していてよかった、という感じ。

www.youtube.com

じつは3曲ほどライブ初披露の曲があった。初披露が3曲というのは、会社員兼業バンドとしてはけっこうチャレンジングなことをやっていると思うのだけれど、限られた練習時間の中でアレンジ、演奏をだいぶ仕上げられて、バンドとしての地力が上がってきていることを感じた。全員40代にもかかわらず、一生懸命やることで向上というのはできるもんである。

このバンドは、「シティポップ系」とか「良質」と評してもらうことが多いのだけれど、自分はロックバンドのつもりでやっていて、ロックバンドの本懐はやはりライブであるとも思っている。であるにもかかわらず、なんとバンドセットでのライブは2022年ぶりということで、せめて一年に一度くらいはバンドセットでのライブを続けていきたいものである。

やっているユニットの曲が島村楽器の店内BGMに選出された

八巻千鶴さんとやっているユニット(こっちはロックバンドのつもりはなくて、ポップスユニットというつもりでやっている)「錦玉もなか」の曲、『天色reverb』が島村楽器の店内BGMに選出された。

www.youtube.com

錦玉もなかの全ての曲は作詞、作曲、編曲、レコーディング、ミックス、マスタリングを自分でやっていて、それを島村楽器の「音源センセイ」という企画に提出した結果ありがたいことに店内BGMとして選出していただけた。錦玉もなかの楽曲の「顔」はとうぜんボーカルなわけで、八巻千鶴さんの素晴らしいボーカルが島村楽器に認められたことはたいへん重畳である。この曲についてはアレンジがかなり気に入っていて、錦玉もなかのいまのところの最高傑作ではないかと思っている。思っているので、それがきちんと第三者に認められたのはほんとうに嬉しいことだ。

ボーダーレスな音楽活動ができた

2月と10月にそれぞれ、友人の主催する音楽会(のようなもの)に参加した。2月の音楽会で特筆すべきは、サックスとピアノとギターのトリオで自作の楽曲をやったことだと思っていて、この曲はポップに聴けつつもビバップマナーを随所に散りばめた、けっこうジャンルとしてくくるのが難しい曲で、自分としては今年できたものの中でいちばん「面白い」というか、意欲的な作品になったと思っている。内輪の音楽会でやったもので、音源、映像の公開の許可をメンバーにとっていないのでここに載せられないのが残念である。

10月の音楽会では、久々にスーツを着込んでクラシック楽曲をやった。サン・サーンス作曲『動物の謝肉祭』より、『象』と『白鳥』をやったのだけれど、本来コントラバスおよびチェロで演奏される楽曲を、セミアコフレットレスベースで演奏した。聴いてくれたひとたちが「ちゃんとクラシック曲として成立していて、しかも聴いたことのない編成で、面白かった」と口々に言ってくれたのがかなり嬉しかった。これも内輪の音楽会でやったものなので公開された音源、映像はない。

ぼくは音楽ならけっこうなんでも好きで、ジャンルに貴賎はないと思っている。だからこういうボーダーレスな音楽活動ができることがすごく楽しいし、そういう音楽を一緒に楽しんでくれるコミュニティがあることはとても幸せなことだと思う。

2025年Bad

なんと、バンドでもユニットでも、今年は音源をリリースしていない。由々しきことである。もう中年であるからして、残された人生の時間を意識しなければならない。ゼロにはなにをかけてもゼロなので、一年にゼロリリースのペースで生きていったらもう残りの人生でリリースできる音源はゼロ、ということになってしまう。音源を残して発表する、ということは、単に「売れたい」の話だけの話ではない。「そのときの自分たちの精一杯」を形に残すことには、かなりの価値がある。

いやまあ本音を言えばそりゃ売れてほしいんですよ。1000億再生されて、みんなで会社員やめて、スタジオ作って、そこで作った音源で家族の学費を稼ぎまくって過ごして行けたら一番いいんだよ。けど、そうなれなかったとしても、「このときに自分たちの音楽はこうだった」を残すことは、ぜったいにいいし、音源を残したことでいろいろな方と知り合う機会になっている友人も多い。記録を残したら、ひょんなことから知ってくれるひとが増える。べつに増えたところで「みんなのうた」に採択されるわけではない。ないけれど、そこで得た縁は、ぼくの音楽人生を絶対に豊かにしてくれる。だから、音源は、作って、発表するべきなんだ、と思っている。

まあでも罷り間違ってまじで1000億再生されたらいいよね。1000億再生されたらこんどはこんなにゆるくできなくなって嫌になっちゃうかもだけど……。ていうかそれだけ再生させるためのプロモーションも各種配信サイトのプレイリストeditorにピッチ(宣伝)を送ることくらいしかしていないけど。ラジオとかにはまた今度投稿してみてもいいかもな。

幸い(?)1月にリリースが予定されている情報未開示の曲が1曲、すでに手元でミックス、マスタリングに進んでいるユニットの曲が2曲、年内ギリギリでレコーディングが終わりそうでミックスに進めそうなバンドの曲が1曲、リズム隊だけは録り終わっているバンド曲が2曲あるので、来年はもっとハイペースで、音楽人として生きた証をネットの海に残していきたい。

来年の抱負

前述のとおり、手元で停滞してしまっている音源がいくつかあるので、これらは全て来年リリースしたいと思っている。上期にこれらをリリースした上で、下期にはバンドセットでのライブをやる、というのが目標となるが、べつに仕事でやってることじゃないのでいくら目標を下方修正してもよい、ということを考えると、錦玉もなかは上期にこれらをすべてリリースした上で、リリース周知もかねてライブを1度は行いたい。下期にさらに1曲リリース、さらにもう一度ライブをしたい。バンドのほうは上期はとにかくレコーディングをハイピッチで進め、手元にある三曲をリリースした上で、下期にはバンドセットでリリース周知を兼ねたライブを行いたい。

とはいえ、ユニット活動もバンド活動も相手がいることなので相手のペースというものも大切だ。もしもこれらの目標が難しいようであれば、そのぶんいろんな友人のボーカルをfeaturingして音源を作り上げていくくらいのアグレッシブさを取り戻す必要があるなと思っている。