中大機構典藏-NCU Institutional Repository-提供博碩士論文、考古題、期刊論文、研究計畫等下載:Item 987654321/85090
English  |  正體中文  |  简体中文  |  全文笔数/总笔数 : 78937/78937 (100%)
造访人次 : 39820760      在线人数 : 1138
RC Version 7.0 © Powered By DSPACE, MIT. Enhanced by NTU Library IR team.
搜寻范围 查询小技巧:
  • 您可在西文检索词汇前后加上"双引号",以获取较精准的检索结果
  • 若欲以作者姓名搜寻,建议至进阶搜寻限定作者字段,可获得较完整数据
  • 进阶搜寻


    jsp.display-item.identifier=請使用永久網址來引用或連結此文件: http://ir.lib.ncu.edu.tw/handle/987654321/85090


    题名: Learning Spatial Search and Map Exploration using Adaptive Submodular Inverse Reinforcement Learning
    作者: 吳季潔;Wu, Ji-Jie
    贡献者: 數學系
    关键词: 空間搜尋;地圖探索;自適應次模;逆強化學習;壓縮感測;Spatial search;Map exploration;Adaptive submodularity;Inverse reinforcement learning;Compressed sensing
    日期: 2021-01-26
    上传时间: 2021-03-18 17:38:20 (UTC+8)
    出版者: 國立中央大學
    摘要: 找到空間搜尋和地圖探索問題的最佳路徑是NP-hard。由於空
    間搜尋和環境探索是人類日常活動之一, 因此從資料中學習人
    類行為是解決這些問題的其中一種方法。利用兩個問題的自適
    應次模性, 本研究提出了一種自適應次模逆強化學習(ASIRL)
    演算法來學習人類行為。ASIRL方法是在傅立葉域中學習獎勵函
    數, 並在空間域上對其進行重建,近似最佳路徑可以透過學習
    獎勵函數算出。實驗顯示ASIRL演算法的表現優於現有方法(例
    如REWARDAGG和QVALAGG)。;Finding optimal paths for spatial search and map exploration problems are NP-hard. Since spatial search and environmental exploration are parts of human central activities, learning human behavior from data is a way to solve these problems. Utilizing the adaptive submodularity of two problems, this research proposes an adaptive submodular inverse reinforcement learning (ASIRL) algorithm to learn human behavior.
    The ASIRL approach is to learn the reward functions in the Fourier domain and then recover it in the spatial domain. The nearoptimal path can be computed through learned reward functions. The experiments demonstrate that the ASIRL outperforms state of the art approaches (e.g., REWARDAGG and QVALAGG).
    显示于类别:[數學研究所] 博碩士論文

    文件中的档案:

    档案 描述 大小格式浏览次数
    index.html0KbHTML153检视/开启


    在NCUIR中所有的数据项都受到原著作权保护.

    社群 sharing

    ::: Copyright National Central University. | 國立中央大學圖書館版權所有 | 收藏本站 | 設為首頁 | 最佳瀏覽畫面: 1024*768 | 建站日期:8-24-2009 :::
    DSpace Software Copyright © 2002-2004  MIT &  Hewlett-Packard  /   Enhanced by   NTU Library IR team Copyright ©   - 隱私權政策聲明