習作ダウンローダー1号のwiki
「試作ダウンローダー1号(仮)」を『習作ダウンローダー1号』に改めました。改版履歴習作ダウンローダー1号の掲示板習作ダウンローダー1号のTwitter●関連作習作ダウンローダー2号 : 公開停止「おう...
NHK高校講座用 試作ダウンローダー3号のページ
高校講座のホームページで公開されている TV/Radio の 動画/音声を
ダウンロードして、ローカルで利用するための ruby script です。
取得物は個人の利用に限り、公開・配布することの無い様にしてください。
動いてコンパイルもできたので、公開してみます。
ご意見、ご感想は掲示板へどうぞ。
・必要な科目の必要な放送回を cui で選択して取得します。
・PDF を取得できます。(要 curl 又は同等品)
・字幕への対応。ttml(字幕データ)取得、ttmk→srt 変換、外字の確認(230904版)
・既にあるファイルは、(壊れていても)ダウンロードしません(*.jsonを除く)。
更新したい時は、古い分を予め削除してください。
・ffmpeg の リトライ対応
・同じ id の放送・PDF を DL しない
放送年度が違っても同じ id の物があるので、既に有る物を残す。
・PDF の取得を ruby で行っても白紙の PDF になります。
ブラウザや curl では成功するので、認証・リダイレクト等の
対応が必要と思われますが、まだできません。
・ログをどう取るか、未定
・メッセージの出力が、$ui.say, putsE, puts, print の混在になっている。
使い分けているつもりはあるが、要整理。
〇kkkz.rb の場合
・OS
>Windows: 10 Ver.1803 以上
PDF の取得に curl が必要な為。PDF 不要 又は curl wget 等の
代替ソフトを用意できればもっと古くても動くかも?
>その他 ruby を実行出来る OS。
・ruby
>2.7 以上。開発・テストは、2.7 と 3.2 で行っています。
〇kkkz.exe の場合
・OS
Windows: 10 Ver.1803 以上
32bit でコンパイルしているので 32/64 bit の両方で動くはずです。
・ruby コンパイルしているので不要
〇両者共通
・curl
PDF の入手に必要です。本家cURL・wget 等の同等ソフトでもいいはず。
PDF が不要なら必要ありません。
・ffmpeg
4.1 ~ 6.0 の複数のバージョンでテストしています。
上記に当てはまらない環境で実行したい場合は、掲示板で連絡いただければ検討します。
以下のリストは google の検索結果からピックアップしただけの物です。
サイトや成果物の品質を保証する物ではありません。
・公式 64bitのみ
https://ffmpeg.org/download.html#build-windows
▽以下 32bit版 を入手できる所 (230817)
・Ver.4.2.1
https://ffbinaries.com/downloads
・Ver.4.3.1 or 20200828 32/64bit
https://web.archive.org/web/20200912071021/https://ffmpeg.zeranoe.com/builds/
・Ver.:6.0
https://github.com/sudo-nautilus/FFmpeg-Builds-Win32/releases
NHK の字幕は ttml 形式となっています。
それは字幕に特化した xml で ARIB-TTML を拡張した物らしいです。
その位置付けは作者の理解では、放送品質の字幕を配信するための中間データで
更に動画用字幕に変換した上で表示しているようです。
なので ttml 字幕対応をうたう 字幕変換サイトや player(vlc mpc-be 等) でも 変換や表示ができません。
そこでオプションをつけて kkkz を起動する(詳細は添付のドキュメントにて)事で
ttml から srt への変換を行える様にしました。
mp と srt を同じディレクトリに置いて、ファイル名を同じにしておく事で、
字幕対応の player で表示できます。
シェアボタン: このページをSNSに投稿するのに便利です。
「試作ダウンローダー1号(仮)」を『習作ダウンローダー1号』に改めました。改版履歴習作ダウンローダー1号の掲示板習作ダウンローダー1号のTwitter●関連作習作ダウンローダー2号 : 公開停止「おう...
旧版履歴が長くなってきたので専用のページを作りました。◎最新版 : 240906(+exe)版NHKdl.exe md5: 38738db893fb4fbce15bc...
習作ダウンローダー2号(旧 試作ダウンローダー2号)ご意見ご要望は、掲示板かTwitterにお願いします。習作ダウンローダー1号の掲示板習作ダウンローダー1号のTwitter●はじめに 機能しなくなっ...
NHK高校講座用 試作ダウンローダー3号のページ 高校講座のホームページで公開されている TV/Radio の 動画/音声をダウンロードして、ローカルで利用するための ruby script です。 ...
まいにちロシア語 in Wikipedia(ja)NHK出版試し読み s://www.nhk-book.co.jp/tachiyomi.html?id=000009147mmyyyyロシアゴスキー i...
まいにち中国語 in Wikipedia(ja)NHK出版試し読み s://www.nhk-book.co.jp/tachiyomi.html?id=000009101mmyyyy(ステップアップ|レ...
まいにちハングル講座 in Wikipedia(ja)NHK出版試し読み s://www.nhk-book.co.jp/tachiyomi.html?id=000009277mmyyyyおもてなしのハ...
習作ダウンローダー1号2号へのご意見ご感想ご要望等ございましたら、こちらへどうぞ。雑談も歓迎いたしますが、不適切とおもわれるコメントは削除させていただきます。...
まいにちスペイン語 in Wikipedia(ja)NHK出版試し読み s://www.nhk-book.co.jp/tachiyomi.html?id=000009145mmyyyy旅する(ための)...
まいにちイタリア語 in Wikipedia(ja)NHK出版試し読み s://www.nhk-book.co.jp/tachiyomi.html?id=000009159mmyyyy旅する(ための)...
まいにちドイツ語 in Wikipedia(ja)NHK出版試し読み s://www.nhk-book.co.jp/tachiyomi.html?id=000009109mmyyyy旅する(ための)?...
まいにちフランス語 in Wikipedia(ja)NHK出版試し読み s://www.nhk-book.co.jp/tachiyomi.html?id=000009113mmyyyy旅する(ための)...
Wikipedia(ja) よりアラビア語講座tv アラビーヤ・シャベリーヤtv テレビでアラビア語tv アラビア語会話 ポルトガル語入門ポルトガル語ステップアップ アジア語楽紀行...
カウンターサイト全体:今日:昨日:更新履歴最近のコメントその他 トップページ ここを編集する...
右メニューサンプル右メニューはヘッダーメニューの【編集】>【右メニューを編集する】をクリックすると編集できます。 ご自由に編集してください。 ここを編集する...
xmlにdirの情報が採用された時は「ラジオ英会話」で先行採用されたのちに他の講座に展開されました。”mp4”から””への変更は小学生の基礎英語とボキャブライダーは時期が異なるので全講座一斉ではありませんでした。
“r”はxmlにdir情報が採用される以前に特定の講座のみに使われていた時期があり、しかも”mp4”に変更される時もあったので失敗したらURLを変えてリトライするようプログラムが必要でした。
現在はxmlのdirの情報に従ってURLを作るようプログラムすれば良いので、候補を設定する必要はないのでは?と思います。
今週、先達のソフトで先週分の DL が出来ない場合があったようです。
習作は、手元では大丈夫でした。
習作は、xml 中の dir="?" の値が原因で DL 出来ない時は
"", "mp4", "r" の三つを候補として再確認するようにしています。
以前にもこの値が変更されたことがあったので残しています。
4つ目の値が出てきたらお手上げですが…
以前は、dir の値が変わる時は全科目で一斉に変わったような
気がします。
5ch のその投稿は見た覚えがありますが、その意味を理解していませんでした。
参考にしたソフトは、同じ wiki3 にある改造版です。
●試作ダウンローダー1号の記事のある所
NHK テレビ・ラジオ 英語講座 総合案内所 PART19 at lavender.5ch.net
214 に投稿されているURLのv8をv10に変更
ツール作者の共有情報では?
ほかのツールとは〇〇〇?
カンニングとは、よそ様のツールのソースや設定を覗いたという意味です;-p)
何年か前にGoogleで検索して見つけたURLのvの数字を変えて確認しました。
仰るような技術力はないので。
例えば「ラジオで!カムカムエヴリバディ」はv7に"lang":"english","program":"everybody"のように記載されています。
「カンニング」とは他のツールのパラメータファイルをご覧になったということでしょうか?
それともこのxmlの存在をどこかで見つけていたという事でしょうか?
NHK のドメイン変更の件、記事を見ましたが、当分新旧併用するとの事で
十分な移行期間があるようです。
情報を提供していただいた皆様、ありがとうございます。
質問続きですみませんが
https://www.nhk.or.jp/gogaku/config/android/config-v10.xml
をどうやって見つけたのかを教えていただきたいです。
アプリの通信をモニターするか、apk を unpack, dump するしか
思いつきませんが、ほかの方法があるでしょうか?
私は今回、english/gendaieigo の投稿を見る前に、カンニングして
追加の作業をはじめました。以前も新番組の url を自分では
見つけられなかったので、なんとかしたいのです。
https://www.nhk.or.jp/gogaku/config/android/config-v10.xml
https://www.nhk.or.jp/gogaku/config/ios/config-v10.xml
末尾のv10はゴガクアプリのバージョンによって変更される
xmlから
"lang":"english","program":"gendaieigo",
あたりを取ってくれば良いと思う
講座ごとに10桁のIDとxmlのURL情報の対応も作れそう
「NHK for School」のドメイン変更への対応について
https://www.nhk.or.jp/school/article/about_new_domain.html
NHKゴガクへの影響は不明ですが、変更タイミングが2025年度後半期初めで、ネット業務必須化と同じタイミングなのでNHK全体で変更があるのかもしれません。
ニュースで現代英語の件、投稿は私ではないですが、他のツールのパラメータファイルに書かれているのでは?投稿がそのツールの更新後のようなので。