RubyのTime#strftimeを覚える(これっきりにしたい)

RubyのTime#strftimeのディレクティブは対称性があるように見えて、そうでもない例外があって覚えづらい。

  %a - The abbreviated weekday name (``Sun'')
  %A - The  full  weekday  name (``Sunday'')
  %b - The abbreviated month name (``Jan'')
  %B - The  full  month  name (``January'')
  %c - The preferred local date and time representation
  %C - Century (20 in 2009)
  %d - Day of the month (01..31)
  %D - Date (%m/%d/%y)
  %e - Day of the month, blank-padded ( 1..31)
  %F - Equivalent to %Y-%m-%d (the ISO 8601 date format)
  %h - Equivalent to %b
  %H - Hour of the day, 24-hour clock (00..23)
  %I - Hour of the day, 12-hour clock (01..12)
  %j - Day of the year (001..366)
  %k - hour, 24-hour clock, blank-padded ( 0..23)
  %l - hour, 12-hour clock, blank-padded ( 0..12)
  %L - Millisecond of the second (000..999)
  %m - Month of the year (01..12)
  %M - Minute of the hour (00..59)
  %n - Newline (\n)
  %N - Fractional seconds digits, default is 9 digits (nanosecond)
          %3N  millisecond (3 digits)
          %6N  microsecond (6 digits)
          %9N  nanosecond (9 digits)
  %p - Meridian indicator (``AM''  or  ``PM'')
  %P - Meridian indicator (``am''  or  ``pm'')
  %r - time, 12-hour (same as %I:%M:%S %p)
  %R - time, 24-hour (%H:%M)
  %s - Number of seconds since 1970-01-01 00:00:00 UTC.
  %S - Second of the minute (00..60)
  %t - Tab character (\t)
  %T - time, 24-hour (%H:%M:%S)
  %u - Day of the week as a decimal, Monday being 1. (1..7)
  %U - Week  number  of the current year,
          starting with the first Sunday as the first
          day of the first week (00..53)
  %v - VMS date (%e-%b-%Y)
  %V - Week number of year according to ISO 8601 (01..53)
  %W - Week  number  of the current year,
          starting with the first Monday as the first
          day of the first week (00..53)
  %w - Day of the week (Sunday is 0, 0..6)
  %x - Preferred representation for the date alone, no time
  %X - Preferred representation for the time alone, no date
  %y - Year without a century (00..99)
  %Y - Year with century
  %z - Time zone as  hour offset from UTC (e.g. +0900)
  %Z - Time zone name
  %% - Literal ``%'' character

これらをちょっと整理してみた。まず、

> t = Time.now
> t #=> 2011-02-27 15:25:06 0900

とする。まず、一番最初に覚えるべきは、

%m/%d/%y  %w
02/27/11  0

というところ。小文字で「m、d、y」はそれぞれ2桁の月、日、年に相当する。wは0..6で曜日を示していて、もちろんカウントは日曜日スタート。

じゃあm、d、yを大文字にしたらどうかというと、Yが4桁表記になるだけで、DやMはまったく別の意味なので要注意。strftimeで全般的に言える法則性として、大文字のディレクティブは、桁数が多かったり、省略形でない形式(SunではなくSundayのように)を示しているというのがある。なので、yが11でYが2011となる。じゃあmとMの関係はどう考えるのっていうことだけど、それは次の重要な表記を覚えれば何がstrftimeの対称性を壊したのかが理解できる。

%H:%M:%S (%p)
15:25:06 (PM)

大文字で「H、M、S」はそれぞれ2桁の時間(24時間表記)、分、秒となる。覚えやすい。pは意味が分からない。pmのpと覚えるしかない。え、なんでamのaじゃないのってことだけど、それは「aは曜日の名前」で使われてしまっていたからじゃないかと推測。pの大文字のPは「pm」と小文字で出力する。この対称性のなさは、もう意味がわからんけど、先ほどの大文字の法則に「より正しい表記が大文字」というのを加えると、そういえば、am/pmの英語的に正しい表記はA.M./P.M.か、もしくはAM/PMだから一応つじつまが合う。と、思ったら逆だった。ああ、ややこしい。

さて、ここでmとMでは、monthとminuteで衝突が起こっている。英語の日付の語彙は、もともと対称性を保ちづらいので、こういうことになっているのだと思う。Yとyは同じものを指しているのに、m/M、d/Dは全然別のもの。

mは月で、Mは分だった。じゃあ残るDは何かと言うと、これはDateの略。

> t.strftime("%D") #=> "02/27/11"
> t.strftime("%m/%d/%y") #=> "02/27/11"

という感じで、Dateというのは%m/%d/%yの略記と考えられる。日本人としては、どうして年号が最後に来てるんだとムッとするけど、一番用いられる標準的な年月日の表記としては%Dを使えということなんだろう。

%Dと対になっているのが、%T、Timeだ。

> t.strftime("%T") #=> "15:25:06"
> t.strftime("%H:%M:%S") #=> "15:25:06"
> t.strftime("%t") #=> "\t"

つまり、Timeは時刻の標準表記で、%H:%M:%Sの別名というわけだ。小文字のtはタブ。まあ文字列フォーマッターだからタブぐらいないと困るし、タブはt以外に割り付けようがない。で、時刻に関係する文字「HMST」と対応する小文字のうち、tとm(minute)はすでに対称性が破れているわけだけど、hとsが何かと言うと、hはなんとbのエイリアスで月名の略称(Jan、Febなど)だ。意味がわからん。sのほうは秒に関係しているけど後述。いずれにしても、最も重要な、y/m/d、H:M:Sに関して、Y以外には対称性なんてないのだということを認識するのが大切。そういえば、時刻のHに関係したものに、Hの12時間表記ともいえるIがある。

> t.strftime("%H:%M:%S") #=> "15:25:06"
> t.strftime("%I:%M:%S") #=> "03:25:06"

これはかなり苦しくて、本当だったら、hが03でHが15になるべきだ。こんなモノを覚えろというのは「たのしいRuby」なんかじゃないと思うし、実際覚える必要はないかもしれないけど、覚えてしまったって誰が困るわけでもないし、実は良いことなのだ。HとIは対になっている。ついでにYとCも、ある種の対になっている。%CはCenturyで2桁の数字を返す。

> t.strftime("%c") #=> "Sun Feb 27 15:25:06 2011"
> t.strftime("%C") #=> "20"

えっ、20世紀!? 助けてドラえもん! Centuryなのに、Yの上位2桁を返してるわけ? 日常用語の世紀とは関係ないってことか。きついな。

なぜrなのか分からないけど、r/Rは秒を抜かした時刻(%T:Time)の別名だ。

> t.strftime("%R") #=> "15:25"
> t.strftime("%H:%M") #=> "15:25"
> t.strftime("%r") #=> "03:25:06 PM"
> t.strftime("%H:%M:%S %p") #=> "15:25:06 PM"

次によく使いそうなのは、a/A、b/Bだ。

> t.strftime("%a - %A") #=> "Sun - Sunday"
> t.strftime("%b - %B") #=> "Feb - February"

「大文字が正式」「小文字は略記」という法則が成り立っている。この2つがどこから来たのかよく分からない。Unixのdateコマンドだろうと思う。BSD由来のMacのdateコマンドを叩いたら、

% date "+%a %A %b %B"
日 日曜日  2 2月
% LANG=C date "+%a %A %b %B"
Sun Sunday Feb February

となった。なるほど……。どうも意味が分からないディレクティブの類はUnix由来らしい。dateコマンドは%x、%Xは、それぞれロケールを意識した日付、時刻を出力する。Rubyも似ているけど、Rubyってロケールどうなってるんだ?

% date "+%x"
2011/02/27
% LANG=C date "+%x"
02/27/11
% date "+%X"
16時15分19秒
% LANG=C date "+%X"
16:15:15

このほかにTime#strftimeで比較的大事そうなのは、ある日時からの経過時間や経過日数、経過週などに使えるやつ。

  • %s:エポック時(1970/1/1 00:00:00 UTC)からの経過秒
  • %j:1月1日から経過日数
  • %W:年初からの週数(ただし、起点を月曜とするか日曜とするか、ISO8601に従うかで、%U、%Vなどバリエーションあり)

sは秒だからいいし、jもフランス語とかだとjourがdayだと覚えればよさげ。もう後は知らん。このぐらい覚えれば十分だろう。

以上の関係を図にすると、以下のようになる。


ちょっとスッキリした。