浙新辦[2005]20號 浙ICP備05073341號 廣告經(jīng)營許可證:杭工商淳廣許2004001號
淳安縣千島湖傳媒中心版權(quán)所有 未經(jīng)授權(quán)禁止復(fù)制或鏡像 網(wǎng)絡(luò)廣告 0571-64831301
杭州網(wǎng)?千島湖網(wǎng) 網(wǎng)絡(luò)支持:杭州網(wǎng)絡(luò)傳媒有限公司
當(dāng)科技感滿滿的“數(shù)據(jù)可視化”邂逅古典的唐詩宋詞,會擦出怎樣的火花?
近日,一組可視化數(shù)據(jù)作品《宋詞繾綣,何處畫人間》(以下簡稱《宋詞》)和《唐女詩人群像》(以下簡稱《唐詩》)在朋友圈刷屏。該作品由浙江大學(xué)CAD&CG國家重點(diǎn)實(shí)驗(yàn)室和新華網(wǎng)數(shù)據(jù)新聞部合作,歷時(shí)半年完成。
團(tuán)隊(duì)分析了5.5萬首唐詩、2.1萬首宋詞,用大數(shù)據(jù)技術(shù)解讀古典唐詩宋詞,意外發(fā)現(xiàn)不少隱藏的信息。
大數(shù)據(jù)顯示
蘇東坡去得最多的地方是杭州
這個(gè)作品長什么樣呢?錢報(bào)記者打開了網(wǎng)頁版的《宋詞》。
多處留白,水墨插圖,素雅的配色風(fēng)格,這個(gè)作品的風(fēng)格“整體上是向山水畫靠攏”的。
據(jù)了解,《宋詞》以《全宋詞》為樣本,為完成這一解讀,團(tuán)隊(duì)分析了近2.1萬首詞作、近1330家詞人、近1300個(gè)詞牌名。而《唐詩》作品的基礎(chǔ),則是5.5萬首唐詩的數(shù)據(jù)分析。
記者觀察到,《宋詞》網(wǎng)頁版是由詩人行跡圖和年代生平圖聯(lián)動(dòng)的時(shí)空圖,以及宋詞詞云圖、意象情緒圖、韻律圖組成的。
在年代生平圖中,記者選中代表“蘇軾”的折線,根據(jù)圖示,顯示出一條“先平再升又平”的折線,其試圖反映的是蘇軾一生的仕途起伏。
和生平圖聯(lián)動(dòng)的行跡圖上,地圖同步出現(xiàn)大小不同的褐點(diǎn),用線連接,每個(gè)點(diǎn)的大小因蘇軾踏足的次數(shù)決定。這呈現(xiàn)的是蘇軾一生的軌跡。從點(diǎn)線圖上看,蘇軾的足跡幾乎遍布整個(gè)宋朝疆域。其中,最大的點(diǎn)所在位置是杭州城,這說明杭州是他最多造訪的地方。
“東風(fēng)”一詞
在宋詞中共出現(xiàn)1264次
隨著頁面下拉,映入眼簾的是宋詞“詞云圖”部分。詞云圖根據(jù)宋詞詞語使用次數(shù)分析,使用次數(shù)越多的字號越大,顏色越深,位置越居中。記者看到,位于正中的詞是“東風(fēng)”,該詞被使用了1264次。排在其后的是“何處”,一共被使用了1157次。排第三的是“人間”,在宋詞中一共出現(xiàn)1061次。
“我們之前了解宋詞唐詩,更多地是一首一首分開理解賞析,而這次的研究讓我們可以從大數(shù)據(jù)層面去尋找詩詞背后所隱藏的信息。”浙江大學(xué)CAD&CG國家重點(diǎn)實(shí)驗(yàn)室設(shè)計(jì)主管張瑋告訴錢報(bào)記者。
此次的研究歷時(shí)半年,浙大團(tuán)隊(duì)和新華網(wǎng)數(shù)據(jù)新聞部制作完成的《宋詞》《唐詩》作品,均以網(wǎng)頁的形式呈現(xiàn),里面包含的信息頗為豐富。其中,信息量最大、制作最為復(fù)雜的當(dāng)屬《宋詞》作品。
“在傳媒行業(yè),如此成熟的傳統(tǒng)文化題材的可視化數(shù)據(jù)新聞作品還很鮮見?!睆埇|說,這也是浙江大學(xué)可視化小組研究團(tuán)隊(duì)在這方面的首次嘗試。
詩人作品中提到“酒”
一半是在追思,三成是開心
團(tuán)隊(duì)不僅分析了《全宋詞》文本表面的信息,還深入挖掘宋詞所表達(dá)的意象含義,整合成意象情緒圖。
意象情緒圖選取了30個(gè)像“月”“酒”等常見的字詞,以蘇軾、李清照等24位高產(chǎn)詞人作為代表。通過大數(shù)據(jù)分析,得出這些意象詞匯所表示的情緒,并將情緒分為五種——“喜怒哀樂思”,然后用餅狀圖表現(xiàn)出各種字詞所表示的不同情緒的比例。
比如詩人在寫“酒”時(shí),近半數(shù)想要表現(xiàn)的意象是懷念和思考。陸游寫“紅酥手,黃滕酒”,或者晏殊寫“一曲新詞酒一杯,去年天氣舊亭臺”,都是在追憶故人以及對人生的思考。還有近三成,是類似朱敦儒筆下“日日深杯酒滿,朝朝小圃花開”的開懷一笑。
那么,大數(shù)據(jù)技術(shù)是如何從宋詞的字里行間體察到詞人當(dāng)時(shí)的情緒呢?
首先,團(tuán)隊(duì)需要將基本只表示某種特定情緒的典型意象整理出來。張瑋說,為了更精確,團(tuán)隊(duì)還專門請來浙大文學(xué)院博士胡秋研進(jìn)行了核對。
負(fù)責(zé)數(shù)據(jù)分析和前端開發(fā)的潘如晟告訴記者,他們會用大數(shù)據(jù)分析上下文,根據(jù)典型意象去計(jì)算該字詞屬于某一情緒的概率,得出詩人最有可能想要表達(dá)的情感。
簡單來說,比如詩人張?jiān)诘摹额}興龍寺老柏院》中寫到:“南鄰北舍牡丹開,年少尋芳日幾回。惟有君家老柏樹,春風(fēng)來似不曾來?!逼渲?,“松柏”表達(dá)的就是一種“追思”的情緒。再聯(lián)系上下文,可以得出“牡丹”和“春風(fēng)”想要傳達(dá)的也是“思”。
通過可視化的數(shù)據(jù)呈現(xiàn)
讓唐詩宋詞真正通俗易懂
當(dāng)問及這項(xiàng)研究的難點(diǎn)所在,張瑋首先提到的是圖表的選擇。為了找到最合適的數(shù)據(jù)呈現(xiàn)方式,許多圖表都是幾易其稿。
合適的圖表,既要美觀,又要能涵蓋所需要呈現(xiàn)的信息,同時(shí)還要表現(xiàn)得直觀,還要與讀者進(jìn)行比較順暢的互動(dòng),這著實(shí)讓團(tuán)隊(duì)費(fèi)了不少工夫。據(jù)張瑋介紹,團(tuán)隊(duì)曾嘗試用“小山峰”視圖去表現(xiàn)詞的抑揚(yáng)頓挫,但考慮到圖像重疊影響觀感,又不利于擺放意象圖像,最后只能作罷。
“人是視覺性的,可視化形式的科普手段,可以把晦澀的古詩詞變得通俗易懂,讓科普擺脫說教或者沉悶的刻板印象,從而起到推廣傳統(tǒng)文化的作用。”浙江大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院副院長陳為說。
這項(xiàng)研究定位是科普,因此選擇分析的對象也以唐詩宋詞最基本的內(nèi)容為主。張瑋說:“這個(gè)產(chǎn)品的制作并不是為了得出某一結(jié)論,而是給人們提供一種探索唐詩宋詞的有趣工具?!币虼?,更多有意思的結(jié)論還有待于讀者們?nèi)グl(fā)現(xiàn)。
來源: 錢江晚報(bào)
千島湖新聞網(wǎng) 責(zé)任編輯:徐滿萍
最新播報(bào)
更多>>圖片新聞
更多>>掌上千島湖
微千島湖
淳安發(fā)布
千島湖新聞
三分鐘語音版
千島GO購
媒美購