プレプリント
J-GLOBAL ID:202202206935904961   整理番号:22P0026417

自動テザーネットシステムによる一般化デブリ捕捉のためのロバストなポリシーの学習【JST・京大機械翻訳】

Learning Robust Policies for Generalized Debris Capture with an Automated Tether-Net System
著者 (6件):
資料名:
発行年: 2022年01月11日  プレプリントサーバーでの情報更新日: 2022年01月11日
JST資料番号: O7000B  資料種別: プレプリント
記事区分: プレプリント  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
※このプレプリント論文は学術誌に掲載済みです。なお、学術誌掲載の際には一部内容が変更されている可能性があります。
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
チャザ宇宙船から発射されたテザーネットは,軌道における大きな宇宙デブリの捕捉と処分のための有望な方法である。このテザーネットシステムは,そのネット発射と閉鎖制御の性能に影響するセンシングと作動におけるいくつかの不確実性源に曝されている。しかし,従来の信頼性ベースの最適化手法は,制御行動の設計を,しかし,様々な発射シナリオおよび目標(デブリ)状態に対して,チャザに対して一般化するために,挑戦的かつ計算的に禁止的である。一般的で信頼性のある制御政策を探索するために,本論文では,ネットダイナミックスシミュレーションとの近位政策最適化(PPO2)アプローチを統合する強化学習フレームワークを提案した。後者は,ネットベースターゲット捕獲のエピソードの評価を可能にし,PPO2に対する報酬フィードバックとして機能する捕獲品質指標を推定する。ここでは,与えられた発射シナリオの下で,移動ネットと目標の状態に基づくネット閉鎖行動のタイミングをモデル化するために,学習政策を設計した。確率的状態遷移モデルを,状態推定と発射作動における合成不確実性を組み込むために考慮した。訓練中の顕著な報酬改善とともに,訓練された政策は,個々のシナリオ上で信頼性ベースの最適化実行で得られたものに近い,捕捉性能(広範囲の発射/目標シナリオ)を示した。【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
宇宙飛行体の運動・軌道  ,  宇宙飛行体 
タイトルに関連する用語 (5件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る