国产毛片a精品毛-国产毛片黄片-国产毛片久久国产-国产毛片久久精品-青娱乐极品在线-青娱乐精品

基于深度學習生成自己的圖像問答模型

發布時間:2021-6-22 14:47    發布者:洞幺邦
關鍵詞: python
基于深度學習生成自己的圖像問答模型
VQA 是什么?:Visual Question Answering

我們可以這樣定義:“視覺問答(VQA)是一種系統,它將圖像和自然語言問題作為輸入, 并生成自然語言答案作為輸出。”
就和下面這張圖片類似:輸入這張圖片和問題,我們期望的答案或許是 black and banana。

VQA 的應用:盲人的視覺問答,搜索引擎(不單單是以圖搜圖或者以文字搜信息,而是結合 圖+問題,搜索出答案),智能駕駛領域,醫療問答等領域。

VQA 的框架:視覺問題回答可以分為兩個部分,即圖像和文本。使用卷積神經網絡(用于圖像數據)和循環神經網絡(用于文本數據)來表示神經網絡方法來解決這個問題。主要思想是從 CNN 得到圖像的特征,從 RNN 得到文本的特征,最后將它們組合起來,通過一些完全連接的層來生成答案。


編輯
搜圖




(這是從 VQA 經典論文中截取的圖片,雖然模型不完全一致,但思路是一樣的)
(Image Source: [url=]https://arxiv.org/pdf/1505.00468.pdf[/url])
本文將介紹一下基于深度學習的easy-VQA數據集和訓練預測過程。
1. 基于簡單圖形生成 easy-VQA 數據集
總共考慮了三種圖形:圓形 (circle),矩形 (rectangle) 和三角形 (triangle) 和八種顏色,將它們兩兩組合,在 64 ∗ 64 的畫布范圍內,隨機生成不同大小,不同顏色的圖形;由于生成圖像時,可以根據該圖像的特征生成特定的問題,基于這種思路,我設計了若干關于圖形和顏色的問題:


生成的數據集大約有 5k 張圖片 50k 個問題,答案分類有 13 種:分別是
yes/or 問題,顏色問題和圖形問題。
YES/NO: Yes, No
Shapess: Circle, Rectangle, Triangle
Colors: Red, Green, Blue, Black, Gray, Teal, Brown, Yellow
2.  在 easy-VQA 上實現圖像問答架構

首先輸入的圖像是64∗64的,對圖像進行若干次卷積核池化操作,可以生成固定長度的向量,這里設置為4096維。samepadding進行填充之后,對該圖片使用3∗3的卷積核進行卷積,得到64∗64∗8;然后經過一層最大池化maxpooling得到32∗32∗8;經過另外一層有16個卷積核的卷積和池化過程,最后將圖片的特征表示轉化成 4096 維的固定長度的向量。
圖 3 2: 圖像處理模型
鑒于easy-VQA的實驗性質,對于它的圖片和問題的設計都比較簡單,問題來自一組固定的模板,為了訓練時間和demo性質的考慮,對于問題的處理,首先使用詞袋模型BOW將每個單詞轉化成一個向量。BOW表示通過計算每個單詞在文本中出現的次數,將任何文本字符串轉換為固定長度的向量。然后將這些向量輸入全連接的前饋神經網絡fully-connected(FC),最終得到問題特征的向量表示。
最后將圖片特征向量和問題特征向量拼接起來,通過 softmax 分類,在由13 種答案組成的答案候選集中選擇概率最高的答案作為輸出。在驗證集上的可以達到不錯的準確率。
編輯
搜圖






可以看到訓練的效果還是不錯的:損失率逐漸下降,準確率逐漸上升;同時模型也并沒有過擬合,訓練和驗證的損失率準確率都比較接近。

編輯
搜圖




問題模型,因為問題比較簡單,使用詞袋模型即可,后面加兩層全連接層,將問題轉化成了向量。
編輯
搜圖




將圖片向量和問題向量融合,輸入進 softmax 分類即可。
編輯
搜圖



編輯
搜圖




最后可以看到達到了 93.8 的 accuracy。



本文地址:http://www.qingdxww.cn/thread-769176-1-1.html     【打印本頁】

本站部分文章為轉載或網友發布,目的在于傳遞和分享信息,并不代表本網贊同其觀點和對其真實性負責;文章版權歸原作者及原出處所有,如涉及作品內容、版權和其它問題,我們將根據著作權人的要求,第一時間更正或刪除。
您需要登錄后才可以發表評論 登錄 | 立即注冊

廠商推薦

  • Microchip視頻專區
  • Dev Tool Bits——使用MPLAB® Discover瀏覽資源
  • Dev Tool Bits——使用條件軟件斷點宏來節省時間和空間
  • Dev Tool Bits——使用DVRT協議查看項目中的數據
  • Dev Tool Bits——使用MPLAB® Data Visualizer進行功率監視
  • 貿澤電子(Mouser)專區

相關視頻

關于我們  -  服務條款  -  使用指南  -  站點地圖  -  友情鏈接  -  聯系我們
電子工程網 © 版權所有   京ICP備16069177號 | 京公網安備11010502021702
快速回復 返回頂部 返回列表
主站蜘蛛池模板: 国内外成人鲁尔山免费大片 | 五月婷婷丁香花 | 欧美天天干 | 国产精品国产精品国产专区不卡 | 久久综合九色欧美综合狠狠 | 啊~用力cao我cao死我公 | 射逼网站 | 国产日本韩国不卡在线视频 | 国产日韩在线欧美视频 | 内地精品露脸自拍视频香蕉 | 精新精新国产自在现拍欣赏网 | 国产91精品一区二区 | 四虎官网| 久热re国产手机在线观看 | 成人三级在线播放线观看 | 亚洲手机在线观看 | 男女无遮挡羞羞视频 | 在线亚州| 日韩欧美福利视频 | 日韩欧美一区二区三区免费看 | 毛片在线视频在线播放 | 爱草在线视频 | 亚洲精品一二三四区 | 韩国a级毛片 | 男人扒开你的下面狂躁的视频 | 在线播放精品 | 青丝影院高清版在线观看 | 在线观看网站国产 | 成人网在线播放 | 亚洲专区视频 | 色花堂你懂的国产第一页 | 精品卡1卡2卡三卡免费视频 | 日韩黄色精品 | 欧美手机在线观看 | 女人十八毛片免费特黄 | 无毒不卡 | 国产在线第一区二区三区可以下载 | 免费一级做a爰片性色毛片 免费一级做a爰片久久毛片潮 | 国产又黄又刺激又爽视频黄 | 亚洲精品不卡视频 | 亚洲最大福利网 |