導讀
在以ChatGPT為代表的人工智能受到社會廣泛關注的情況下,博物館的數字化建設需要適應這一變化,從新技術的發展中獲益。博物館本身也應該利用這一契機,重新審視AI時代對博物館工作的要求,推進自身的變革并探索博物館領域新的生長點,重新規劃我們的工作方式和業務生態。
一、引言
ChatGPT自2022年11月30日橫空出世,很快吸引了社會各界的注意力,繼2016年的阿爾法圍棋(AlphaGo)擊敗圍棋世界冠軍李世石后,人工智能再次引發社會熱潮,成為一個街談巷議的話題。現在,以ChatGPT為代表的人工智能技術在持續迭代中快速發展,并不斷地刷新人們的認知。當人工智能開始走向通用,被廣泛接受并融入社會,它就可能會在各個領域發揮重要的作用,而作為主要公共文化機構的博物館當然也是其中的必要一環。從理論上說,人工智能在博物館中的作用似乎有無窮無盡的可能性,這也意味著它將成為智慧博物館建設的重要一部分。
二、ChatGPT、AIGC與人工智能
1、相關技術的概念
人工智能是計算機科學的一個分支,也是一個各學科融合的交叉學科。人工智能領域眾多,計算機視覺、機器學習、自然語言處理、機器人和語音識別向來被視為人工智能的五大重點領域或者說是核心技術。從自然語言處理和機器學習領域脫胎而成的AIGC,則被認為有望引領內容產業的新一輪生產力變革。AIGC狹義上來說就是利用AI自動生成內容的生產方式;廣義的AIGC可以看作是像人類一樣具備生成創造能力的AI技術。ChatGPT則只是AIGC的一個應用而已,當然ChatGPT本身也在迭代進化當中。
2、相關技術的演進
當約翰·麥卡錫等人在1956年8月底的達特茅斯之夏會議上提出并討論“人工智能”這一概念,大概沒能想到人工智能這條路會走得這么艱難,在前30多年幾乎默默無聞。當然也沒想到60多年后的今天,人工智能技術會借著AIGC的東風而這般如日中天,開始對社會造成如此巨大的影響。
從1956年“人工智能”概念首次被提出至今,人工智能大致經歷了三次發展時期。第一次為初創期(1956—1974年)。該時期的任務是讓機器具備簡單的邏輯推理能力,也相繼取得了一批令人矚目的研究成果,如機器定理證明、跳棋程序等。第二次為成熟期(1975—1992年)。人工智能技術始終還是在波浪式發展,實用型的知識庫系統和知識工程成為80年代AI研究的主要方向,一些專家系統在醫療等領域取得成功。第三次為繁榮期(1993年至今)。這一時期,計算性能上的基礎性障礙已被逐漸克服。2006年,深度學習理論的突破更是直接帶動了人工智能走向了一個嶄新的階段,互聯網、云計算、大數據等新興技術也為人工智能各項技術的發展提供了充足的數據支持和算力支撐。隨著AIGC的不斷發展,最近更是迎來了爆發式增長的新高潮。2014年,深度學習模型“生成式對抗網絡”(GAN)推出并迭代更新,2022年則成為AIGC的爆發之年,12月16日,美國《科學》雜志發布了2022年度科學十大突破,AIGC赫然在列。同樣是在2022年,從引爆AI作畫領域的DALL-E 2、Stable Diffusion等AI模型,到以ChatGPT為代表的接近人類水平的對話機器人,AIGC不斷刷爆網絡,AI生成內容種類豐富且效果逼真,其強大的內容生成能力給人們帶來了巨大的震撼。
三、人工智能在博物館應用的現狀
1、國外博物館的人工智能實踐
國外博物館比較早就注意并引入人工智能技術,傳播服務領域是首先的受益者。2010年,谷歌公司在舊金山一家畫廊舉辦AI藝術展“深夢:神經網絡藝術”,引發了藝術界關于AI創作的作品能否算作藝術品的熱烈爭論。2014年8月13日,英國泰特美術館進行了為期5天的“夜幕”活動,通過網絡遠程操控小機器人,足不出戶卻能身臨其境地參觀泰特美術館當時正在展出的“英國藝術500年”展覽。2016年,泰特美術館又引入了意大利法布里卡團隊研發的視覺識別程序,在掃描并學習了3萬多幅泰特美術館的藏品后,程序可以在路透社的新聞圖片庫與泰特美術館的作品圖片庫之間基于視覺和主題的相似性進行對應匹配識別(圖1),并將這些對應成功的圖片在泰特美術館網站上建立一個不斷增長的虛擬畫廊。同年,挪威國家博物館與加州大學伯克利分校合作,采用神經網絡和深度學習技術,用來自于維基百科的文本資料對館藏的藏品圖像進行識別訓練,訓練圖像依照相似度進行聚類,并在此基礎上自動形成按主題、顏色和風格分類的展示(圖2)。

圖1 泰特美術館的圖片智能匹配

圖2 挪威國家博物館的藏品圖像聚類
2018年,紐約現代藝術博物館(MoMA)的數字媒體團隊和Google藝術與文化實驗室合作,開展通過機器學習和計算機視覺技術在舊展覽照片中識別每件藝術品的項目。團隊使用算法來梳理30000多張舊展覽照片,并從中尋找與MoMA在線展示的65000多件作品相匹配的照片。現在,我們在MoMA網站上,從一張1929年畫展上的照片打開一個鏈接,可以看到保羅·塞尚的標志性作品(圖3)。2019年,西班牙達利美術館推出“達利活了”項目。博物館收集了6000張達利生前的影像,讓計算機花1000小時學習達利的臉部及身體動作,以人工智能技術重現達利身影,創造了一個AI達利(圖4),并可以與觀眾進行互動。2019年另外一個主要的成果來自于美國大都會藝術博物館和微軟、麻省理工學院的合作項目。項目利用現在生成式對抗網絡從大都會藝術博物館的館藏中隨機選取藝術元素,然后把這些元素拿來通過GAN進行訓練,再通過算法推演組合隨機創建成一個藝術品,觀眾還可以在影像生成后自行調整每個藝術品“成分”的比重,給博物館的文創開辟了一條新路(圖5)。

圖3 紐約現代藝術博物館從舊展覽照片中識別藝術品

圖4 西班牙達利美術館“達利活了”項目的互動裝置

圖5 大都會藝術博物館利用GAN進行新“藝術品”生成的演示圖
2、國內博物館的人工智能實踐
與國外博物館相比,國內博物館在人工智能應用方面還不太重視,為數不多的一些應用也往往流于表面。目前,相對較好的一些應用大概是在文物修復方面。2017年,上海博物館在進行“董其昌數字人文綜合展示系統”項目開發時,引入人工智能技術。項目的作品欄目運用卷積神經網絡(CNN)等深度學習技術來分析明代繪畫作品中的一些基本元素,經訓練后,系統可自動地完成畫面元素的識別和歸類,構成素材數據抓取和聚類的自動化模式(圖6)。在董其昌項目的基礎上,“‘宋徽宗和他的時代’數字人文專題”做了進一步的探索。這一項目基于上海博物館繪畫藏品數據開展主題詞分析,研發書畫類文物專題知識圖譜。項目團隊在董其昌項目所做的書畫藏品識別的基礎上,針對印章、題跋,以及擴展至花鳥、人物等的繪畫元素,利用人工智能技術進行信息提取。項目采用深度學習的方法,以卷積神經網絡提取藏品圖像的特征,運用監督/無監督方法學習特征分布到類別的映射,實現對繪畫元素的自動識別、標注,并構建基于構圖元素的繪畫內容的索引,查詢比對與分析系統,并通過K-means算法來實現圖像的聚類,以此輔助繪畫的研究和鑒賞工作(圖7)。
總之,博物館,尤其是國內博物館,在人工智能的運用上還顯得比較稚嫩,應用場景也顯得單調,但這也顯示出人工智能在博物館的運用具有巨大空間。

圖6 董其昌作品畫面元素的識別和歸類

圖7 宋徽宗作品中的印章識別與聚類
四、影響人工智能在國內博物館應用的主要因素
1、缺乏創新性思維
國內的博物館數字化或智慧化建設已經開展了很長的一個時期,但很多博物館人還是沒有認為它是一種必需品,仍然視之為錦上添花的附加品。這種觀念導致很多館不愿意為數字化工作去開動腦筋、花大力氣,其結果就是國內的博物館數字化建設始終在原有的數據采集、藏品管理及服務導覽等有限的范圍之內兜圈子,建設項目的同質性問題始終無法解決。所以,要沖破目前的數字化建設的瓶頸,就必須自上而下擺脫習慣性思維,就必須提倡創新性思維。
我們必須體認和接納數字化帶來的新工作模式和工作方法,在破與立之中重建新的平衡,在多學科的參與下協同創新,發展出屬于其自身的新的成長空間。也只有在這樣的基礎上,代表新生產力的人工智能技術才可能順利地接軌博物館的業務工作。
2、封閉式的業務模式
在人文類博物館,單打獨斗的個體研究也還是一種常態,學術孤島現象普遍存在。而且由于研究人員來源學科的單一,而博物館實際研究學科又有細分化趨勢,使得研究方式的細微精深成為博物館研究的常態。這與目前多學科融合研究的趨勢背道而馳,更是與當前數字技術背景下的知識生產方式格格不入。
此外,ChatGPT之所以能夠成功,海量的數據訓練功不可沒,這就要求有一個開放性的數據環境。在國內,智慧博物館建設開展以來,各館都在做藏品數據的采集,僅全國移動文物普查中,統一標準登錄文物完整信息的國有可移動文物就有2661萬件/套,登錄文物照片達5000萬張,數據總量超過140TB,這也是智慧博物館建設最大的基礎性成果。但事實上,業外人士依然望資源而不可得。造成這一狀況的原因并不在技術和資源本身,而是在博物館人的固有思維上。要解決這一問題,需要博物館人員,尤其是管理者建立開放性思維并轉變封閉式的業務模式。人工智能時代的到來,正是一個契機,是打開博物館資源封閉大門的一把鑰匙。
3、數據基礎薄弱
人工智能,數據是基礎。博物館當前的數據資源,從量上來看確實不少,但在質的方面就很難恭維,甚至可以用薄弱來形容。這個弱首先體現在由于采集標準不統一,以及各館之間的人力和財力的不平衡,造成各館的數據采集質量差別很大,特別是大館和中小館之間,差距顯而易見。如果這一弱點通過投入還可以盡快彌補,如數字化項目中添置硬件設備,那么在不易察覺的軟的一塊,其薄弱則更讓人擔心。
我們需要多加努力,盡快建立起博物館自己的數字資源建設標準規范,也要建立對網上資源進行搜集、篩選、編目、加工、使用的方法和相應的技術標準規范,還要建立開放的、可互操作的數字資源組織與管理標準規范,以及建立可互操作的數字對象調度機制等。在統一標準下形成良好的數據集和語料庫,為人工智能的訓練和學習提供優質的數據基礎。
五、博物館數字化建設中人工智能應用的考量
1、重視人工智能技術在博物館的應用
面對人工智能技術的飛速發展,博物館持何種態度,決定了它會如何作為。博物館管理者應當正確理解當前人工智能技術飛速發展的本質,充分認識到人工智能時代所帶來的機遇和對博物館工作的推動,努力發揮自身數據資源獨特而豐富的優勢,有效利用自身專業所長順勢而為,抓住機遇主動融入當前由人工智能技術引發的社會發展。我們需要順應人工智能的潮流,在貢獻屬于博物館領域的智慧和解決方案的同時,推進博物館的變革并探索博物館領域新的生長點,重新審視AI時代對博物館工作的要求,重新定位博物館的核心能力,重新規劃博物館的工作方式和業務生態。
2、把握人工智能在博物館的主要應用場景
在博物館服務領域,類似ChatGPT的智能問答將大行其道,不僅能夠取代近幾年以程序生成的機器問答,也足以代替人工型的知識問答。博物館的導覽程序也可以通過接入人工智能技術而使觀眾獲得如自助查詢、智能推薦等更便捷和全面的體驗。
在研究領域,“人文學科,研究人類社會和文化各方面的學術學科(如歷史、語言學、政治、神學和文學),面臨著數字工具和方法所帶來的機遇,這些工具和方法可以促成變革性的創新研究”。在研究工作中,除了能夠提高資料檢索效率以及當作寫作助手以外,AIGC對不同來源的研究資源的不斷補充和對使用對象的一視同仁會進一步模糊了行業之間的界限區分,有助于打破學科界限,有利于跨學科合作研究的形成。此外,在博物館藏品及其相關數字資源累積了龐大的資源和能量以后,可以在保持原有研究特點和優勢的前提下,去嘗試進行以數字資源為主要對象的數字化研究工作。在最近進行的上海博物館民國紙幣研究系統的開發中,我們就通過AI技術,采集獲取紙幣上各種信息,并進行匯聚、比照,獲得深入研究所需要的信息源(圖8)。通過調用數據集進行各類特征的自動排列和比對,有利于博物館民國紙幣研究工作的開展和相關知識圖譜的構建。

圖8 民國紙幣研究系統中的紙幣簽名識別和聚類
在展覽展示領域,既可以在策展過程中利用AIGC工具,按描述從數據庫中自動將關聯數據生成不同主題并進行推送,以此形成簡單的策展文案和展品目錄,提高策展的效率和水平;也可以利用機器學習算法對目標觀眾的喜好和興趣進行預測和分析,更加精確地設計展覽內容和展品,提高展覽的吸引力和參觀體驗;可以利用AIGC工具高效生產圖像、視頻、3D模型等,并結合已有的文本和數據直接生產出更加智能化和更富有敘事性的可視化產品。
3、理性對待人工智能應用的利弊
博物館的人工智能應用還是要以博物館的宗旨為依歸,以博物館的業務需要和業務發展為中心,既要從實際出發,循序漸進,不盲目沖動,不為技術所綁架,又要抓住機會,促使新興技術成為推動博物館轉型升級的引擎,也要警惕并防止脫序而產生災難性的后果。
六、結 語
在新技術革命浪潮席卷全球之際,博物館需要勇敢面對,順勢而為。雖然ChatGPT等人工智能技術在目前來看還并非十全十美,甚至在某些方面還存有一定風險,但其在問題理解、人機交互方面的強大,以及由此帶來的內容生成方面的潛力是不容忽視的。未來已來,博物館要充分借助數據資源優勢,融合人工智能等新型技術,為更好地實現博物館的數字化轉型和創新發展服務。