習作ダウンローダー1号のwiki
「試作ダウンローダー1号(仮)」を『習作ダウンローダー1号』に改めました。改版履歴習作ダウンローダー1号の掲示板習作ダウンローダー1号のTwitter●関連作習作ダウンローダー2号 : 公開停止「おう...
NHK高校講座用 試作ダウンローダー3号のページ
高校講座のホームページで公開されている TV/Radio の 動画/音声を
ダウンロードして、ローカルで利用するための ruby script です。
取得物は個人の利用に限り、公開・配布することの無い様にしてください。
動いてコンパイルもできたので、公開してみます。
ご意見、ご感想は掲示板へどうぞ。
・必要な科目の必要な放送回を cui で選択して取得します。
・PDF を取得できます。(要 curl 又は同等品)
・字幕への対応。ttml(字幕データ)取得、ttmk→srt 変換、外字の確認(230904版)
・既にあるファイルは、(壊れていても)ダウンロードしません(*.jsonを除く)。
更新したい時は、古い分を予め削除してください。
・ffmpeg の リトライ対応
・同じ id の放送・PDF を DL しない
放送年度が違っても同じ id の物があるので、既に有る物を残す。
・PDF の取得を ruby で行っても白紙の PDF になります。
ブラウザや curl では成功するので、認証・リダイレクト等の
対応が必要と思われますが、まだできません。
・ログをどう取るか、未定
・メッセージの出力が、$ui.say, putsE, puts, print の混在になっている。
使い分けているつもりはあるが、要整理。
〇kkkz.rb の場合
・OS
>Windows: 10 Ver.1803 以上
PDF の取得に curl が必要な為。PDF 不要 又は curl wget 等の
代替ソフトを用意できればもっと古くても動くかも?
>その他 ruby を実行出来る OS。
・ruby
>2.7 以上。開発・テストは、2.7 と 3.2 で行っています。
〇kkkz.exe の場合
・OS
Windows: 10 Ver.1803 以上
32bit でコンパイルしているので 32/64 bit の両方で動くはずです。
・ruby コンパイルしているので不要
〇両者共通
・curl
PDF の入手に必要です。本家cURL・wget 等の同等ソフトでもいいはず。
PDF が不要なら必要ありません。
・ffmpeg
4.1 ~ 6.0 の複数のバージョンでテストしています。
上記に当てはまらない環境で実行したい場合は、掲示板で連絡いただければ検討します。
以下のリストは google の検索結果からピックアップしただけの物です。
サイトや成果物の品質を保証する物ではありません。
・公式 64bitのみ
https://ffmpeg.org/download.html#build-windows
▽以下 32bit版 を入手できる所 (230817)
・Ver.4.2.1
https://ffbinaries.com/downloads
・Ver.4.3.1 or 20200828 32/64bit
https://web.archive.org/web/20200912071021/https://ffmpeg.zeranoe.com/builds/
・Ver.:6.0
https://github.com/sudo-nautilus/FFmpeg-Builds-Win32/releases
NHK の字幕は ttml 形式となっています。
それは字幕に特化した xml で ARIB-TTML を拡張した物らしいです。
その位置付けは作者の理解では、放送品質の字幕を配信するための中間データで
更に動画用字幕に変換した上で表示しているようです。
なので ttml 字幕対応をうたう 字幕変換サイトや player(vlc mpc-be 等) でも 変換や表示ができません。
そこでオプションをつけて kkkz を起動する(詳細は添付のドキュメントにて)事で
ttml から srt への変換を行える様にしました。
mp と srt を同じディレクトリに置いて、ファイル名を同じにしておく事で、
字幕対応の player で表示できます。
シェアボタン: このページをSNSに投稿するのに便利です。
「試作ダウンローダー1号(仮)」を『習作ダウンローダー1号』に改めました。改版履歴習作ダウンローダー1号の掲示板習作ダウンローダー1号のTwitter●関連作習作ダウンローダー2号 : 公開停止「おう...
旧版履歴が長くなってきたので専用のページを作りました。◎最新版 : 240906(+exe)版NHKdl.exe md5: 38738db893fb4fbce15bc...
習作ダウンローダー2号(旧 試作ダウンローダー2号)ご意見ご要望は、掲示板かTwitterにお願いします。習作ダウンローダー1号の掲示板習作ダウンローダー1号のTwitter●はじめに 機能しなくなっ...
NHK高校講座用 試作ダウンローダー3号のページ 高校講座のホームページで公開されている TV/Radio の 動画/音声をダウンロードして、ローカルで利用するための ruby script です。 ...
まいにちロシア語 in Wikipedia(ja)NHK出版試し読み s://www.nhk-book.co.jp/tachiyomi.html?id=000009147mmyyyyロシアゴスキー i...
まいにち中国語 in Wikipedia(ja)NHK出版試し読み s://www.nhk-book.co.jp/tachiyomi.html?id=000009101mmyyyy(ステップアップ|レ...
まいにちハングル講座 in Wikipedia(ja)NHK出版試し読み s://www.nhk-book.co.jp/tachiyomi.html?id=000009277mmyyyyおもてなしのハ...
習作ダウンローダー1号2号へのご意見ご感想ご要望等ございましたら、こちらへどうぞ。雑談も歓迎いたしますが、不適切とおもわれるコメントは削除させていただきます。...
まいにちスペイン語 in Wikipedia(ja)NHK出版試し読み s://www.nhk-book.co.jp/tachiyomi.html?id=000009145mmyyyy旅する(ための)...
まいにちイタリア語 in Wikipedia(ja)NHK出版試し読み s://www.nhk-book.co.jp/tachiyomi.html?id=000009159mmyyyy旅する(ための)...
まいにちドイツ語 in Wikipedia(ja)NHK出版試し読み s://www.nhk-book.co.jp/tachiyomi.html?id=000009109mmyyyy旅する(ための)?...
まいにちフランス語 in Wikipedia(ja)NHK出版試し読み s://www.nhk-book.co.jp/tachiyomi.html?id=000009113mmyyyy旅する(ための)...
Wikipedia(ja) よりアラビア語講座tv アラビーヤ・シャベリーヤtv テレビでアラビア語tv アラビア語会話 ポルトガル語入門ポルトガル語ステップアップ アジア語楽紀行...
カウンターサイト全体:今日:昨日:更新履歴最近のコメントその他 トップページ ここを編集する...
右メニューサンプル右メニューはヘッダーメニューの【編集】>【右メニューを編集する】をクリックすると編集できます。 ご自由に編集してください。 ここを編集する...
XML用の新しいオフセットのデータを書きました。
伊西仏独露中韓で変更が必要です。
英語関係に変更は有りません。
240906版で、聞き逃し番組の表示と絞り込みにジャンルを導入しました。
出力するまで時間がかなりかかるようになりました。(-_-;)
ジャンルのヒントをくださった名無しさん、ありがとうございました。
ジャンルのデータが判りました。
"https://www.nhk.or.jp/radio-api/app/v1/"の下に在る
"series/genres" がキーと名前の組
"web/ondemand/series?genre=#{キー}" がジャンル別の番組のデータ
いずれも Json です。
取り入れるかどうか、検討中です。
allP で見ているデータは
https://www.nhk.or.jp/radio-api/app/v1/web/ondemand/corners/new_arrivals
の物です。そこにあるのは、放送波、番組id、番組名、副題と
id、放送日、サムネの url です。
番組id や id はジャンル別に整理された値には見えません。
ジャンル別のデータが、どこにあるのか不明です。
らじる聴き逃しでは「語学」(language)などジャンルでフィルタがかけられるようですが、ジャンルの情報がjsonファイル内にないように思います。
ジャンルの情報から語学番組をフィルタすることもできるかな、と思いました。
jsonファイル内にジャンル情報があるようでしたら、どのキー情報になっているのかお分かりになりますか?
https://www.nhk.or.jp/radio/ondemand/index_genre.html?genre=language
240824版で、コマンドラインに番組名や番組 id の一部を指定して
直接ダウンロードできるようにしました。
NHKdl.(rb|exe) Direct レベル1 レベル2 "in E"
とする事で、基礎英語1,2,in English を落とせます。
なにか不具合や疑問があればこの掲示板で教えてください。
240813版の時にアイデアはありましたが、上手く実装出来ませんでした。
詳しい説明ありがとうございます。
番組名部分一致のキーワードでDL出来る機能と勘違いしました。
ちゃんと読まないとダメですね。失礼しました。
allP(allProgramの略のつもり) は 240809版で新設したオプションで
NHKdl.(exe|rb) allP とすることで、らじるらじるの聞き逃し番組の
放送波、番組id、番組名の一覧を出力します。
240813はんでは、allP の後ろに 番組名の一部を続ける事で
フィルタリングできるようにしました。
フィルタリングが無いと、200行以上のりすとになるので
会 語 ハングル とすることで語学系はカバーできると思います。
allD(allData)もあって、json、xml の生データを保存します。
こちらは、フィルタリング無のデバッグ用です。
allP とは何でしょうか?
ワイルドカードのようなもの?
勉強不足な質問で申し訳ありません。
-absf aac_adtstoasc の件ですが、
-absf は廃止されましたが -bsf:a は使えるようです。
ffmpeg 3~7 でテストした結果
-bsf:a に変更します。