葡京娱乐场-富盈娱乐场开户_百家乐试玩_sz全讯网网址xb112 (中国)·官方网站

|
北京理工大學(xué)
北京理工大學(xué) 工業(yè)和信息化部
  • 42 高校采購(gòu)信息
  • 934 科技成果項(xiàng)目
  • 1 創(chuàng)新創(chuàng)業(yè)項(xiàng)目
  • 0 高校項(xiàng)目需求

北理工團(tuán)隊(duì)研發(fā)出首個(gè)視覺(jué)提示遙感多模態(tài)大模型

2025-01-22 17:02:50
云上高博會(huì) http://www.74jv82s.xyz

2025年1月,北京理工大學(xué)前沿交叉科學(xué)院數(shù)據(jù)流體團(tuán)隊(duì)研發(fā)出首個(gè)視覺(jué)提示遙感多模態(tài)大模型,相關(guān)成果以“EarthMarker: A Visual Prompting Multi-modal Large Language Model for Remote Sensing”為題,發(fā)表在國(guó)際頂級(jí)期刊《IEEE Transactions on Geoscience and Remote Sensing (TGRS)》。

EarthMarker為遙感通用大模型EarthGPT的延續(xù),首次實(shí)現(xiàn)了遙感領(lǐng)域中基于視覺(jué)提示的多模態(tài)大模型,支持多粒度的視覺(jué)提示和自然語(yǔ)言聯(lián)合提示,實(shí)現(xiàn)了多粒度解譯遙感圖像,并可靈活切換遙感圖像解譯粒度,如圖像、區(qū)域和點(diǎn)粒度。此外,本文提出了首個(gè)遙感視覺(jué)提示大規(guī)模多模態(tài)數(shù)據(jù)集,包含約365萬(wàn)多模態(tài){圖像-點(diǎn)-文本}和{圖像-區(qū)域-文本}配對(duì)數(shù)據(jù),數(shù)據(jù)集已全部開(kāi)源。

EarthMarker可完成復(fù)雜視覺(jué)推理任務(wù),尤其在遙感目標(biāo)關(guān)系分析任務(wù)中性能超越GPT-4V。如圖1所示,EarthMarker展示出驚人的分析能力:其首先總結(jié)了視覺(jué)提示所標(biāo)識(shí)區(qū)域分別為機(jī)場(chǎng)環(huán)境中的不同要素, 接著對(duì)相同類別的區(qū)域進(jìn)行了聚類分析,并推理出這些標(biāo)注區(qū)域在機(jī)場(chǎng)環(huán)境中的不同功能。

圖1 EarthMarker完成復(fù)雜推理任務(wù):遙感關(guān)鍵標(biāo)關(guān)系分析(黃色高亮部分表示錯(cuò)誤)

綜合來(lái)講,EarthMarker具備多才多藝的能力。如圖2所示,EarthMarker可實(shí)現(xiàn)多粒度(如圖像級(jí)、區(qū)域級(jí)和點(diǎn)級(jí))遙感圖像解譯,擅長(zhǎng)于各種視覺(jué)任務(wù),包括場(chǎng)景分類、指定對(duì)象分類、圖像描述、關(guān)系分析等。

圖2 EarthMarker具備多粒度遙感圖像解譯能力,可實(shí)現(xiàn)多任務(wù)推理

EarthMarker的總體架構(gòu)如圖3所示,提出了一種共享視覺(jué)編碼機(jī)制,以增強(qiáng)視覺(jué)提示、整體圖像和文本指令之間的交互理解。此外,文中設(shè)計(jì)了跨域三階段學(xué)習(xí)策略,使得EarthMarker具備了空間感知和聯(lián)合指令跟隨能力。該研究貢獻(xiàn)了視覺(jué)和語(yǔ)言聯(lián)合提示多模態(tài)理解框架,并構(gòu)建遙感多模態(tài)聯(lián)合提示指令數(shù)據(jù)集,展示出了極大的應(yīng)用潛力。

圖3 EarthMarker總體架構(gòu)

EarthMarker更多信息詳見(jiàn):

論文鏈接:https://ieeexplore.ieee.org/document/10817639

開(kāi)源鏈接:https://github.com/wivizhang/EarthMarker

同系列模型:

EarthGPT:國(guó)內(nèi)首個(gè)遙感大模型,100萬(wàn)圖文指令數(shù)據(jù)集已全部開(kāi)源!

論文鏈接:https://ieeexplore.ieee.org/document/10547418

開(kāi)源鏈接:https://github.com/wivizhang/EarthGPT

Popeye:首個(gè)海洋船舶視覺(jué)語(yǔ)言模型

論文鏈接:https://ieeexplore.ieee.org/document/10738390

百家乐视频视频| 红9百家乐的玩法技巧和规则| 百家乐官网怎样下注| 百家乐路纸计算| 赌场百家乐规则| 全讯网五湖四海| 百家乐官网加牌规则| 网上百家乐官网新利| 网络百家乐官网会作假吗| 百家乐的必赢方法| 大发888提款之后多久到账| 百家乐五湖四海娱乐场| 六合彩玄机| 网上百家乐官网是假| 百家乐赌博公司| 安徽棋牌游戏中心| 广州百家乐官网牌具公司| 太阳城王子酒店| 新彩百家乐官网的玩法技巧和规则| 澳门赌场| 新梦想百家乐官网的玩法技巧和规则| 星空棋牌大厅下载| 永康市| 哪个百家乐技巧平台信誉好| 网上百家乐骗钱| 百家乐官网代理每周返佣| 百家乐闲单开多少| 利来网站| 博九百家乐官网的玩法技巧和规则 | 百家乐博娱乐平台赌百家乐| 南京市| 做生意挂什么画招财| 百家乐9点直赢| 百家乐官网群柏拉图软件| 百家乐客户端软件| 百家乐手机版| 澳门百家乐官网玩大小| 威尼斯人娱乐怎么样| 豪门百家乐官网的玩法技巧和规则| 大发888登不上| 娱乐城注册送18体验金|