も少しラジオを聴きやすくする その3

プレイリストは次を生成。
1. 全てのラジオ プログラムのリスト
2. 年ごとのリスト
3. 直近50プログラムのリスト
4. 阿澄佳奈さん関連のリスト
この内、3.は直近1週間のリストを代替するもの。
以上で、手作業で行っていたリスト作成をスクリプトに置換した。
約6,000トラックで生成完了に約20分。
このくらいなら、バックグラウンドで毎日実行しても問題ないレベルかな。
# 2018. 7.27 追記: サーバで実行したら5分程度になりました。

ラジオはデコードの誤差があるため前後1minを余分に録音して、
手作業で切り出してタグ付けしている。
プログラムの休止やゲスト情報があるため、残りの自動化は難しいだろうなぁ。
AI使えば出来なくはないかも?
内容をテキスト化 → 要約を生成 → ゲスト名を抽出、休止を判定 → タグ情報を修正
→ 放送時間変更の予告から次回の録音時間を変更 → etc
参考:ファイル名を変更したスクリプトの例

#!/bin/bash
CMD="aa.sh"
# 引数チェック
if [ $# -ne 2 ]; then
echo "指定された引数は$#個です。"
echo "usage: $0 directory time"
exit 1
fi
DIR=$1
TIME="-"$2
TEMPTAG="_temp"
rm ${CMD}
find ${DIR} -type f | while read file
do
name=`basename "${file}"`
ext="${name##*.}"
if [ $ext != "jpg" ] ; then
# filename analysis
basename=`echo ${name} | sed 's/\.[^\.]*$//'`
ymd=`echo ${basename} | sed -r 's/^.*([0-9]{8}).*/\1/'`
expr "${ymd}" + 1 >/dev/null 2>&1
if [ $? -lt 2 -a ${#ymd} -eq 8 ] ; then
rename=`echo ${file} | sed -r 's|'${ymd}'|'${ymd}$TIME'|'`
src=`echo ${file} | sed -r 's| |\\\ |g'`
trg=`echo ${rename} | sed -r 's| |\\\ |g'`
echo "mv ${src} ${trg}" >> ${CMD}
#mv "${src}" "${trg}"
fi
fi
done
chmod 700 ${CMD}

とりあえずのところ、やりたいことは出来たので完了。