中大機構典藏-NCU Institutional Repository-提供博碩士論文、考古題、期刊論文、研究計畫等下載:Item 987654321/85060
English  |  正體中文  |  简体中文  |  全文笔数/总笔数 : 80990/80990 (100%)
造访人次 : 42729323      在线人数 : 1265
RC Version 7.0 © Powered By DSPACE, MIT. Enhanced by NTU Library IR team.
搜寻范围 查询小技巧:
  • 您可在西文检索词汇前后加上"双引号",以获取较精准的检索结果
  • 若欲以作者姓名搜寻,建议至进阶搜寻限定作者字段,可获得较完整数据
  • 进阶搜寻


    jsp.display-item.identifier=請使用永久網址來引用或連結此文件: http://ir.lib.ncu.edu.tw/handle/987654321/85060


    题名: 適用於多特性多用途的分散式關連分群機制;A Distributed Correlation Based Mechanism for Adaptive and Divergent Purposed Clustering
    作者: 李桂昇;Lee, Kuei-Sheng
    贡献者: 資訊工程學系
    关键词: 大型資料;分群演算法;分散式系統;機械學習;Big Data;Clustering;Distributed system;Machine learning
    日期: 2021-01-18
    上传时间: 2021-03-18 17:32:05 (UTC+8)
    出版者: 國立中央大學
    摘要: 在機械學習的領域中,分群分析(Cluster analysis)一直是很重要的一門技術。資料分群後會讓具有相似特性的單元聚類在一起,從而得知其中有用或隱含的訊息。然而目前主流的分群分析演算法皆需要全面性分析整體資料以取得演算法中的最佳參數,如此一來,面對大型資料的處理將難以施展。
    本研究提出一種非監督式學習 (Unsupervised Learning)分散式關連分群機制。假設同一群中相鄰資料點皆為二二相似,則可依此特性關連至更多的資料點而為一個完整的群組。而在處理資料的時候,可將大型資料拆解分散至多台電腦,平行計算任二筆資料間的關連,之後再過濾及彙整處理結果集結為群組。
    在本研究實作時使用了二維圖形、圍棋分析及醫學資料做為實驗數據,依資料類型不同分別訂定了相似性計算方式。實驗結果顯示出此分群機制處理大型資料的能力,同時也提供了良好的執行效能,更有其準確性、適用性及易用性等特性。
    ;Cluster analysis is an important technique in the field of machine learning. Data clustering allows units with similar characteristics to be clustered together in order to learn useful or implicit information. However, current mainstream cluster analysis algorithms need to analyze the whole dataset comprehensively to obtain the best parameters, which makes it difficult to process large-scale dataset.
    This study proposes a distributed correlation-based clustering mechanism based on unsupervised learning. If neighboring data points in the same group are similar, then they can be related to more data points to form a complete cluster according to this characteristic. In processing the data, a large-scale dataset can be disassembled and distributed to multiple computers to calculate the correlation between any two pieces of data in parallel, and then the results are filtered and aggregated into a cluster.
    This study uses 2D graphics, Go game (Weiqi) analysis, and medical data as experimental data, and similarity calculations are developed according to the data types. The experimental results show the ability of this clustering mechanism to handle large-scale dataset. This clustering mechanism provides advantages such as good execution performance, accuracy, variability, applicability, and ease of use.
    显示于类别:[資訊工程研究所] 博碩士論文

    文件中的档案:

    档案 描述 大小格式浏览次数
    index.html0KbHTML121检视/开启


    在NCUIR中所有的数据项都受到原著作权保护.

    社群 sharing

    ::: Copyright National Central University. | 國立中央大學圖書館版權所有 | 收藏本站 | 設為首頁 | 最佳瀏覽畫面: 1024*768 | 建站日期:8-24-2009 :::
    DSpace Software Copyright © 2002-2004  MIT &  Hewlett-Packard  /   Enhanced by   NTU Library IR team Copyright ©   - 隱私權政策聲明