網路使用者圖像標記行為初探-Flickr圖像標籤為例

 

林宸均

國立台東大學教育學系()教學科技碩士班

 

壹、前言

    電腦的應用發達,許多事情都已經由電腦代勞,然而到目前為止,電腦對於語音辨識、機器翻譯、圖形識別等工作始終存在著技術上的困難。圖形識別中最有用的分析,就是為每張圖片標註關鍵詞並且加以分類,這對網路的圖片檢索服務至關重要,但是要自動加註關鍵詞,卻困難重重。電腦只能根據像素的數值本身去作各種數學上的分析與判斷,而對畫面內容本身一無所知;在這種情況下,若是目標物體被局部遮擋,甚至是些許縮小,就很有可能判斷不出來。

    上述的工作用人腦來解決卻可以輕易的迎刃而解。因為電腦和人腦在基本上的運作有著很大的差異,人類大腦可以做抽象的思考與圖形的識別,電腦卻缺乏了這些感知的能力。為了使電腦能更接近人類的思維,社群功能豐富的網路相簿Flickr便應運而生。其標籤(Tags)功能讓使用者可自行定義該圖片的關鍵字,間接利用了人類智能來提高圖片搜尋結果的廣度。Flickr這項功能除了讓使用者自行對圖片進行註記外,也實現了資源共享機制,透過叢集分類技術,讓找出來的圖片能夠更符合使用者的需求。

    一般而言,圖像通常欠缺文字說明,但在搜尋時,卻多是以字找圖,沒有字,就找不到圖。因此在經由人腦運算後所過濾出來的圖像關鍵詞,反映了使用者檢索圖片的觀點,是建立圖像索引時,絕佳的入口詞彙(Entry Term)來源(卜小蝶,2007168-14)。

    使用者本身就存有著對資訊的需求,不論是社會、心理的因素都會影響標記的行為及其對標籤的選擇。筆者根據網路相簿Flickr使用者的圖像標籤註記,探討使用者理解圖像時的感知、詮釋、視覺規則、對圖像感興趣與關注的區域、如何對網路資源進行標記以及如何選用標籤詞彙,並簡單歸納這些圖像標籤的類別與特性,作為日後改善圖像檢索技術的參考。

 

貳、相關研究

一、眾「智」成城的網路社群

    網路社群就是建構在資訊科技或網際網路上的虛擬式人群組合,所有的互動與溝通皆透過數位化的處理來達到。而它最大的意義在於,社群網站利用人有與其他人產生互動、情感維繫以及得到更多資訊的需要,提供一個虛擬空間,讓關心相同主題的使用者群聚在一起並且分享資訊(周冠中、郭美懿,2000)

    社群內容就是利用群體智慧匯集而成的資訊,將網路價值最大化。這其實是社群會員或部落客的「反饋」行為,企業拋出強烈誘因(高額獎金、熱門商品、特殊經驗)和「需要解決」的議題供網友參與,人說網路臥虎藏龍,尤其是「意見領袖」的部落客們各個充滿創意和自我風格,非常衷於分享、貢獻、及幫助社會,於是供需之間取得了交會點,企業節省成本卻得到更多元的創意或作品,網友們則在分享中獲得利益和成就感(于文強,2008)

 

二、網路圖像標籤

    所謂的「標籤」(Tag),其實就是關鍵字(Keyword)或索引詞彙(Index Term)(卜小蝶,2007161-7)。其本質是指由使用者共同為各種資源進行標記(User Tagging(卜小蝶,2002781-94。換言之,即由使用者個人來做索引(User Indexing),進而集結成共同索引的機制。基本上,沒有文字的資源,如圖片、影片等,最需要使用者標記機制,主要當然是因為這些物件(Object)缺乏文字說明,也沒有脈絡(Context)可循,若有大量標籤,對於資訊檢索自然會有相當助益(Trant & Wyman, 2006)。

    Tapscott2006)認為做為一種新的組織與分類科技,Tag 鼓吹的是「有機的分類」,或說「活的分類」,隨著時間點的不同,類別的面貌有著不同的變化。它連結的不只是資訊,更是一群潛在的他人,使用者隨心所欲分類的同時,可以看到和自己興趣相近的人,如何進行自我分類,或者都在找尋什麼樣的資訊(Golder & Huberman, 2006; Tapscott, 2006)。

    卜小蝶(2006)提到tagging相對於控制字彙的嚴謹、權威、統整、精確、及穩定,使用者詞彙就顯得相當鬆散、個人、零碎、模糊、與變動。但同時也較能反應新資訊,及完整呈現一個概念的多元意義。字彙品質未受訓練、且無規範的使用情境下,使用者自由標記的方式並不易達到正確性及一致性(如單複數、字根、縮寫、別名、格式等)。

    Flickr請使用者在上傳圖片時,幫圖片貼上標籤,每張圖片可以貼75tags,換句話說,使用者可以為每張圖片以主角、拍攝地點、心情、場合等等貼上「標籤」;而上網搜尋圖片的人,就可以依tags來瀏覽圖片。透過標籤又可以發現同好或使用者感興趣的圖片。Flickr沒有停留在簡單的一級標籤,它還透過叢集(clusters)進一步細化標籤,幫助使用者更快的找到需要的資訊(PuichingWiki2008)。

 

三、圖像標記行為

 標記是相當簡單的一個過程,當我們瀏覽過需要標記的標的物後,接著腦中開始計算、衡量標的物和候選概念間的相似性,接著便寫下這些概念(楊雅婷,2006)。標記行為在這個階段中並不牽涉過濾或篩選的行為,可以為標的物註記任何數量的聯想詞彙(Sinha, 2006)

Sen, et al. (2006)歸納出標記行為普遍來說可支持五種使用者任務:

     1. 自我表達(Self-expression):標記的特性可以幫助使用者表達個人的意見。

     2. 組織行為(Organizing):標記可幫助使用者組織個人的資訊項目。

     3. 學習(Learning):幫助使用者知道更多和某個資訊項目相關的知識。

     4. 尋找(Finding):幫助使用者找到個人想要的資訊項目。

     5. 決策支援(Decision support):幫助使用者決定是否使用或瀏覽某個資訊項目。

    使用者主動訂標籤的行為,方便了其他使用者能更快地找到所需的內容。Ross Mayfield(2005)探討使用者主動訂標籤背後的動機。他認為最初的動機來自於利己,讓自己的照片和文章有更清楚的分類,讓他人更容易地找到自己的作品,進而提高曝光率。但就在此同時,廣大使用者進行同類的行為,無意間也提供了標籤彙整網站 (Flickr, Technorati) 大量的資訊,讓他們能將內容整理分類,方便大眾搜尋,間接地積累了一筆利他的功德(Tiger蕭,2006)。

     Flickr的圖片多是由個人相簿集結而成。基本上,分類或索引都具有相當主觀色彩,因此要視分類的目的來決定Tagging的特性與範疇,例如為他人或為自己的資源Tagging,其動機及行為就會有相當差異(Marlow, Naaman, & boyd, 2006)。

 

   四、圖像資訊內容

    圖像資訊所表達的意涵不單僅是物件本身,絕大部份是來自物件本身的屬性。譬如說,「黑暗中昏黃朦朧的燈光」可能帶給人們溫暖、舒適與安心的感覺;而「清晨雲霧繚繞的森林」則可能會使人有涼爽、清新的感受(神曉玲,1996)。每個人對於圖像的理解與詮釋不同,因此,我們有時候很難斷定某筆圖像資訊究竟應該包含哪些主題。

    Shatford Layne認為,基本上圖像目錄至少應包含下列四點(張瀚文,1999):

    1.書目:即該筆圖像資訊記錄的產生、流通方式、典藏狀況等;

    2.主題:圖像資訊中所表達的時間、空間、活動或事件、物體;

    3.實體:即圖像的實體形式描述;

    4.關聯性:該筆記錄與其他圖像或文本之間的關係。

為了讓一幅圖像資訊的內容主題能夠儘可能地被分析,Sara Shatford1986)特別將一幅圖畫可能呈現的意義分為兩種:「屬於」(Of)以及「關於」(About);前者指的是圖像中所描繪的事件或物體,後者則是其所表達的意涵。其中「屬於」還可分為廣義與狹義;廣義是指該事務所屬的類別,狹義則較為專指,為個別事物(張瀚文,1999)。另外,再利用人物(Who)、事件(What)、地點(Where)、時間(When)等四個層面,細分圖像的意義。詳見下表:

 

表一、Sara Shatford1986)圖像資訊內容模式

層面(Facets

屬於(Of

關於(About

狹義(Specific Of

廣義(Generic Of

人物(Who

有個別名稱的人、動物、事物

某一類型的人、動物、事物

某人或物所象徵的抽象意涵

事件(What

有個別名稱的事件

行動、情況

情緒或事件的抽象表達

地點(Where

有個別名稱的地理區

某一個地理區或建築地

含有抽象象徵意義的地區

時間(When

某個時間、日期或時期

某個季節或時日

某個時間所象徵的抽象情緒

 

參、研究方法與發現

    本文主要利用網路相簿Flickr使用者所下的圖像標籤作為分析來源,筆者利用Sara Shatford的圖像內容分析模式,在Flickr挑出以人、事、時、地、物(又細分成人物、動物、事物)五個層面為主的圖像為分析主題,每個層面各挑出三種圖像樣本,圖像主題設定好後,使用Flickr的叢集功能收攏不同使用者針對不同主題所下的標籤詞彙進行比對分析。

    分析策略上採用內容分析,選擇樣本因缺乏完全共同性,標籤也是不同使用者自訂,因此圖像的標籤會有些許差異,但叢集功能所收攏的詞彙是大部分的使用者針對特定主題憑直覺所下的標籤,因此可以判定這些詞彙歸類就是多數使用者一致註記的標籤。因為不是同一使用者所下的標籤,並未進行量化交叉統計,而是單純對使用者所下的標記詞彙做歸納分析。

    例如以人物的層面來說,分別挑選了王建民、瑤瑤和蜘蛛人,最後歸納出使用者對人物圖像的感知、詮釋與關注的特徵、如何對網路資源進行標記以及如何選用標籤詞彙其他層面則以此類推,並簡單分析這些圖像標籤詞彙的特性。

    Flickr圖像數量至2008年已經突破30億張,若每一張圖像都將它註記一個標籤,那就有30億個標籤,當然要排除掉重複的部份,但資料還是相當豐富。而一般使用者為了使自己的相簿或網站曝光率提高,標記的數量也就越多,當然標記的關鍵詞也要越精準越能正中其他使用者的需求,網站的瀏覽率相對也就提高,間接實現了資訊分享。

 

 

 

表二、圖像資訊內容分析模式-圖像列舉

層面(Facets

屬於(Of

關於(About

狹義(Specific Of

廣義(Generic Of

人物(Who

王建民

大聯盟投手

台灣之光

瑤瑤

電玩美少女

殺很大

蜘蛛人

漫畫人物

超級英雄

動物(Who

鴿子

鳥類

和平

狐狸

犬科

狡猾

驢子

馬科

愚笨

事物(Who

Louis Vuitton

知名品牌

時尚

鑽石

首飾

誓約

保時捷

跑車

速度

事件(What

911攻擊

恐怖攻擊

邪惡權勢

H1N1

流感病毒

疫情

季後賽

球賽

競賽

地點(Where

耶路撒冷

以色列

宗教信仰

巴黎

法國

浪漫的

埃及

非洲

古文明

時間(When

1031

萬聖節前夕

不給糖就搗蛋

214

西洋情人節

愛情

74

美國獨立紀念日

愛國主義

 

資料來源:筆者自行整理

 

   

 

以下的圖表針對網路相簿Flickr搜尋特定圖像進行圖像標籤的分析比對,並歸納出使用者對理解圖像時的感知、詮釋、視覺規則、對圖像感興趣、關注的區域及詞彙類別與特性。底線斜體表示使用者所使用的關鍵詞比例相當高,粗斜體表圖像之象徵意涵。

 

表三、網路使用者註記之標籤詞彙歸類(英文詞彙)

層面(Facets

狹義(Specific Of

網路使用者註記之圖像標籤

人物(Who

王建民

(Chien-Ming Wang)

baseball, yankees, mlb, newyork, wang, taiwan, nyc, newyork yankees, ny, yankeestadium, 40, pitcher, sinker, stadium, 台灣之光

瑤瑤

瑤瑤Show girl線上遊戲殺online殺很大

童顏巨乳、電玩美少女

蜘蛛人(Spiderman)

共分為四個叢集:

 marvelcomicstoy,  toyssuperherocomic

  herohulkironmanwolverine

spider,  boyman,  childredkidwebblack,

  macrospiderweb

ƒcostumehalloweencosplay, animeconvention

supermanbatmansuperheroes wonderwoman

動物(Who

鴿子

(dove)

共分為三個叢集:

birdpigeonnature, birds, mourning dove

wildlifeskyanimalwhite, peace

italyitalia

ƒflickrdiamond, diamondclassphotographer

狐狸

(fox)

共分為四個叢集:

 wildlife, animal, nature, redfox, red, wild, zoo,

  naturesfinest, mammal, sleight

Japan, shrine, Kyoto, inari, shinto, kitsune, statue,

  Tokyo, nikon, d300, nikkor80400mmf4556

ƒ dog, terrier, wire, puppy, pet, dogs, fox terrier

ukurbanengland,  londongarden

驢子

(donkey)

共分為三個叢集:

animal, burro, farm, mule, ass, nature, horse, donkey

morocco, africa, travel, maroc, marrakech, medina

ƒgreece, santorini, island, cyclades, greek, europe

 

 

 

 

 

 

 

 

 

 

 

事物(Who

Louis Vuitton

共分為四個叢集:

 LV, vuitton, paris, louis, France, fashion, bag,

  shopping,  purse,  handbag , 503cw, 80mmcft

newyork, nyc, New york city, manhattan,

  Fifth avenue,  usa,  ny,  losangeles,  california

ƒ Tokyo, Japan, ginza, omotesando, roppongi, 

  architecture,  roppongihills,  light,  shinjuku

window, shop, store, display, reflection, night

鑽石

(diamond)

共分為四個叢集:

ring, engagement, wedding, gold, macro, jewelry,

  love, rings, white, marriage

diamondclassphotographer, photographer, class, flickrdiamond, flickr, abigfave, anawesomeshot, blueribbonwinner 

ƒhead, hawaii, oahu, waikiki, honolulu, beach

baseball, field, stadium, diamond-made lineup

保時捷

(Porsche)

共分為四個叢集:

 car, auto, carrera, racing, gt3, gt, race, turbo, speed,

  automobile

ferrari, lamborghini, bmw,  audifordmercedes,

  f430gallardo

ƒvw, Volkswagen

astonmartin

事件(What

911攻擊

(911 attack)

共分為一個叢集:

World Trade Center, 911 Attack, terrorists attack, ground zero,WTC, NYC, New York City, devil

H1N1

共分為一個叢集:

influenza,  flu,  epidemic,  swine,  Mexico ,

Swine flu,  cubrebocas,  pandemia,  virus,  pest status

季後賽

(playoffs)

共分為四個叢集:

hockeynhldetroit stanleycupcupstanley,

  sharksiceredwings

nbabasketballboston sportscelticsgame,

  pistonslakersactionsox

ƒ baseball,  mlb,  nlds,  chicago,  cubs,  phillies,

  philadelphia,  redsox,  dodgers,  alcs

football,  nfl,  stadium,  soccer,  chargers,

  High school,  cheerleaders,  patriots,  eagles 

地點(Where

耶路撒冷

(Jerusalem)

共分為兩個叢集:

Israel, oldcity, western wall, Jewish, wall, Palestine,  wailing wall, church, Dome of the rock, city, religion

mosque, dome, Islam, Muslim, rock

巴黎

(Paris)

共分為四個叢集:

 France, street, Notre-dame, church, architecture,

  cathedral, art, city, romantic

Eiffel, tower, night, Eiffeltower, toureiffel, Europe,

  tour, nuit

ƒbridge, seine, river

Louvre, museum, pyramid

埃及

(Egypt)

共分為四個叢集:

Cairo, Giza, pyramid, desert, sphinx, mosque, camel,africa, travel

Nile, river, boat, sunset, water, aswan, nilo, felucca,

  cruise, egipto,

ƒred sea, diving, sea, underwater, fish, scuba, blue,

  beach, sinai, sun

Luxor, temple, Egyptian, Karnak, ancient, statue,

  museum, art, Abu Simbel, Ancient civilization

時間(When

1031

(萬聖節前夜) Halloween

共分為四個叢集:

pumpkin,  orangejackolantern,  fallhob

  autumnoctobercarvingblack

costumepartycostumesfunfriendsgirl

  kidsportraitdogwoman

ƒscaryspookynight creepydarkskull

  ghostbloodskeletonhorror

nycnewyorkparade,  newyorkcity

214

(情人節)

Valentine Day

共分為兩個叢集:

 love, heart, valentine, red, hearts, valentines,

  valentines day, amour

rose, flower, red rose,

74

(美國獨立紀念日)

Fourth of July

共分為三個叢集:

 fireworks, independence day, july4th, July, night,

  celebration, july4, independence, holiday, fourth

flag,  America,  usa,  patriotic,  American,

  American flag,  blue,  white,  stars and stripes

ƒ stars,  stripes  

 

資料來源:筆者自行整理

 

針對上表將部分英文圖像標籤轉譯成中文圖像標籤後整理出使用者對圖像首要標記的詞彙(方框中表示使用者對圖像的主要聚焦點,粗斜體表象徵意涵),並逐一分析詞彙類型,再歸納其圖像感受認知與圖像關注的特徵。如下表所示:

 

表四、網路使用者註記之標籤詞彙分析(中文詞彙)

層面(Facets

狹義(Specific Of

使用者註記之圖像標籤

人物(Who

王建民

(Chien-Ming Wang)

棒球、洋基、美國職棒大聯盟、投手、伸卡、王建民、台灣、40、紐約、紐約洋基、棒球場、台灣之光

叢集分析

主題所屬球隊、地點、職業、背號、專長球種

瑤瑤

瑤瑤線上遊戲、殺online殺很大、童顏巨乳、Show girl電玩美少女

叢集分析

主題所屬職業、角色象徵、外形特色、聯想

蜘蛛人

(Spiderman)

共分為四個叢集:

 奇特人物、連環漫畫、玩具、超級英雄

   、鐵人、金鋼狼

蜘蛛、男孩、男人、小孩、紅色、網、黑色、

  蜘蛛網

ƒ變裝、萬聖節、角色扮演、動畫、傳統

超人、蝙蝠俠、超級英雄

叢集分析

主題周邊商品、角色象徵、聯想人物、模仿

歸納結果

Ü圖像感受認知:欣賞與喜愛的崇拜對象、感興趣的對象、精神糧食

Ü圖像關注特徵:關聯事物、職業、任務、背景、角色頭銜、角色聯想

 

 

 

 

 

 

動物(Who

鴿子

(dove)

共分為三個叢集:

 、家鴿、自然、動物、野生動物、天空

  、哀鴿、白色、和平

義大利

ƒ flickrdiamond, diamondclassphotographer

叢集分析

主題種類、所屬科別、聯想、地點、評價

狐狸

(fox)

共分為四個叢集:

 野生動物、動物、自然、野生、動物園、

  哺乳動物、狡猾

日本、神龕、京都、稻荷、神社、雕像、東京、nikond300nikkor80400mmf4556

ƒ 狗、獵犬、獵狐、寵物

烏爾班、英國

叢集分析

主題類別、所屬科別、地點、聯想、相機資訊

驢子

(donkey)

共分為三個叢集:

 動物、小毛驢、農地、騾、馬、自然、蠢蛋

摩洛哥、非洲、麥地那、馬拉喀什、旅行

ƒ希臘、島嶼、基克拉澤斯、希臘人、歐洲

叢集分析

主題類別、所屬科別、地點、聯想

歸納結果

Ü圖像感受認知:對主題既定印象、主題連結的象徵意涵

Ü圖像關注特徵:主題象徵、生長環境、地點、性情、歸類科別

 

 

 

 

 

 

 

 

事物(Who

 

 

 

 

 

 

 

 

 

事物(Who

Louis Vuitton

共分為四個叢集:

  LV、購物、巴黎、法國、時尚、包包、

  vuitton、錢包、手提包、503cw80mmcft

紐約、曼哈頓、第五大道、美國、洛杉磯、

  加州

ƒ東京、日本、銀座、六本木、建築物、新宿

櫥窗、購物、商店、展示

叢集分析

名牌包、流行時尚、LV設櫃據點、相機資訊

鑽石

(diamond)

共分為三個叢集:

 戒指、誓約、婚姻、婚禮、首飾、愛情、

  白色、金製品

diamondclassphotographer, photographer, class, flickrdiamond, flickr, abigfave, anawesomeshot, blueribbonwinner 

ƒ夏威夷、歐胡島、懷基基、檀香山、海灘

棒球、野手、體育場、鑽石打線

叢集分析

堅貞愛情、首飾、相片評價、地點、形容詞

保時捷

(Porsche)

共分為四個叢集:

 車子、自動、競速、速度、gt3carreragt

   、渦輪增壓器、汽車

法拉利、藍博基尼、寶馬、奧迪、福特、  

  莫西迪絲

ƒVW、德國大眾汽車公司

Aston martin (Ford集團旗下的高級車品牌)

叢集分析

主題本身、車型、顏色、速度、車種

歸納結果

Ü圖像感受認知:主題聯想、主題所在地點、慾望、需求

Ü圖像關注特徵:喜愛的高貴事物、奢華、崇高地位、追求時尚

 

 

事件(What

911攻擊

(911 attack)

共分為一個叢集:

世貿中心911 攻擊、恐怖攻擊、美國紐約世貿大樓災變現場、紐約市、邪惡權勢

叢集分析

發生日期、地點、恐怖組織、譴責聯想

H1N1

共分為一個叢集:

流行性感冒、傳染病、豬隻、豬流感、墨西哥、大流行病、病毒、疫情

叢集分析

傳染病毒、感染地區、傳播媒介

季後賽

(playoffs)

共分為四個叢集:

 曲棍球、全國曲棍球聯盟、獎盃、史坦利盃、

  底特律

全國籃球協會、籃球、運動、波士頓、

  塞爾提克、競賽、活塞隊、湖人隊

ƒ 棒球、美國職業棒球大聯盟、國家聯盟分區

  系列賽、芝加哥、小熊隊、費城人隊、紅襪

  隊、道奇隊、美國聯盟冠軍賽

美式足球、全國橄欖球聯盟、體育場、英式

 足球、高中、啦啦隊長、愛國者、老鷹隊

叢集分析

各式球類競賽、球隊聯盟、所屬球隊、聯想

歸納結果

Ü圖像感受認知:主題所造成的影響、精神層面、記憶、成就榮耀

Ü圖像關注特徵:主題發生時間、地點、主題類別、事件型態

地點(Where

耶路撒冷

(Jerusalem)

共分為兩個叢集:

 以色列、舊城、西牆、猶太人、巴勒斯坦

 、哭牆、教堂、岩頂圓頂寺宗教信仰

清真寺回教的禮拜堂、伊斯蘭教、回教徒

叢集分析

所屬國家、當地建築、地標、聯想

巴黎

(Paris)

共分為四個叢集:

 法國、香榭大道、巴黎聖母院、建築物、

  主教教堂、藝術、浪漫的

艾菲爾鐵塔、歐洲、旅行、不眠夜

ƒ大橋、萊茵河

羅浮宮、博物館、現代金字塔

叢集分析

所屬國家、當地建築、洲別、地標、聯想

埃及

(Egypt)

 

 

 

共分為四個叢集:

 開羅、吉薩、金字塔、沙漠、獅身人面巨像

 、清真寺回教的禮拜堂、駱駝、非洲、旅行

尼羅河、船、日落、亞斯文、三桅小帆船

ƒ紅海、潛水、魚、水肺潛水用的水下呼吸器

  海灘、西奈半島、太陽

盧克索、寺廟、埃及人、凱爾奈克、古代的、

  雕像、博物館、藝術、阿布辛貝、古文明

叢集分析

境內城鎮、當地建築、環境特徵、聯想、象徵

歸納結果

Ü圖像感受認知:主題建築之象徵意涵、主題聯想

Ü圖像關注特徵:主題特色、隸屬國家、重要建築、歷史文物

時間(When

1031

(萬聖節前夜) Halloween

共分為四個叢集:

 南瓜、橘黃色、秋天、惡作劇、搗蛋、十月

  、雕刻、黑色

變裝、派對、有趣、朋友、人物描寫、狗

ƒ 駭人的、骷髏頭、毛骨悚然的恐怖的

 、黑暗、鬼魂、血、夜晚、似幽靈的

紐約市、遊行隊伍

叢集分析

節慶習俗與裝飾品、時節、駭人的、地點

214

(情人節)

Valentine Day

共分為兩個叢集:

 愛情、心、戀人、戀情、情人節、紅色

玫瑰、花朵、紅玫瑰

叢集分析

愛情、花朵、顏色、戀人

74

(美國獨立紀念日)

Fourth of July

共分為三個叢集:

 煙火、獨立紀念日、七月四日、慶典、假期

國旗、美國、愛國心的、美國國旗、星條旗

ƒ 星星、條紋

叢集分析

慶典、日期、地點、象徵、聯想

歸納結果

Ü圖像感受認知:主題象徵意涵、記憶、獨有重要性、聯想

Ü圖像關注特徵:日期、代表性事物、發生地點、不成文習俗、特色

 

資料來源:筆者自行整理

 

綜合以上所述及歸納,研究發現如下:

一、Flickr圖像標記現象

      (一)中英文關鍵詞檢索出的詞彙數量有相當大的差異 

               利用中文關鍵詞檢索,資料量較少;反之利用英文關鍵詞檢索,則資

           料量較多。原因可能是Flickr2003年推出後直到2007年的年底才擁有

           中文化的介面,加上網路社群全球通用,因此使用英文關鍵詞進行檢索得

           到的資料量是相當豐富的。以「蜘蛛人」來說,輸入Spiderman檢索所得

           的資料筆數共有42795張,輸入蜘蛛人檢索所得的資料筆數卻只有71張。

      (二)使用者會依圖像內容資訊熱門程度來進行分享的行為;圖像內容資訊的熱

           門程度會因不同地域的使用者對其之喜好程度而有所差異。

           以「王建民」來說,輸入Chien-Ming Wang檢索所得的資料筆數共有

           1099張,但輸入王建民檢索所得的資料筆數竟高達3182張,表示使用者(

           別是華人地區)有可能會依照圖片內容的人事物目前的熱門程度或針對有

           興趣的議題來進行分享,間接提升了資料量。

   二、使用者在Flickr所使用的詞彙類別與特性

      (一)使用者在Flickr所使用的詞彙類別經筆者歸納有:人事時地物、對圖像內

           容主題與背景事物之描述、相機關聯資訊(多為一群攝影愛好者的集結,是

           一種純技術的分類,如d300nikon)、評價(多為參雜情緒的字眼,常是作

           者與社員對圖像的評論或讚賞,如flickrdiamond)、感知、聯想等六種類別。

      (二)使用者在Flickr所使用的詞彙特性經筆者歸納有:

          1.標籤詞性複雜:多數事物的詞性多以名詞為主,在tagging中卻以圖像中最

            關注的區域或個人感受來做註記,可以是形容詞、動詞或副詞,不再受限

            於傳統分類。

          2.詞彙間彼此對等:以巴黎的主題為例,法國與巴黎應該屬不同階層的分類,

            但在tagging中巴黎可以等於法國也可等於艾菲爾鐵塔,清楚的去除了階

            層。

          3.詞彙冗長贅詞多:不同拼法、同樣意涵的詞彙重複使用,因為標籤數目的

            不受限,造成tagging沒有嚴謹的規則性。

          4.圖像主體與客體皆可能因主觀而成為主角:tagging可以依個人需要自由的

            分類,註記權力下放給使用者,主觀與感受可以使圖像中的客體變為主體。

          5.重視資源的分享與評價:累積一定圖像的數量,也對品質有一定的控管,

            評價的優劣決定著圖像的存廢。

 

   三、使用者網路圖像標記行為

      (一)使用者標記行為之程度

          1.為個人使用目的來進行圖像標記

            使用者可能只純粹當作個人的使用,故標記詞彙含有個人化定義。

          2.為自己與其他使用者來進行圖像標記

            當使用者標記的目的是為了想主動分享與社群互動,使用者除了使用自己

            習慣的詞彙以外,也會考量與其他使用者圖像標籤的互通性。

      (二)使用者標記行為之認知過程

           大部分的網路使用者的標記行為可說是憑直覺的下標籤,針對圖像的內容

           以個人直覺並運用聯想力去下關鍵字。

 

   四、使用者選擇標籤詞彙的方式

      (一)使用者會針對最圖像的主要內容來下標記。

      (二)人類讀圖視覺規則會專注於主題目標顯著及與主題相關聯的部分。

           人類讀圖的視覺規則是觀察一幅圖像時,會將焦點置於其中的前景主題對

           象和主要的背景區域。若感興趣的區域非常顯著,往往就可抓到圖像的主

           要訊息,所下的標籤也就越準確。

      (三)使用者會參考社群的受眾、個人經驗的感受、圖像資訊內容、個人慣用的

           分類名稱、個人註記、於搜尋引擎搜尋的慣用關鍵字彙、標籤同義字、對

           圖像內容的聯想來作為圖像標籤的詞彙。

 

肆、討論與結論

   一、圖像資訊的組織整理不受限於傳統的目錄分類模式,更應重視圖像內容的分析

       及其隱藏的意涵,因為圖像所要傳達的意義在經過理解、詮釋後往往才是使用

       者最關切的部份。

 

二、無序性的tagging讓人們起而思考去制定規範或期望使用者能夠善加控管標籤的

品質並具備篩選標籤的素養,如此就能使系統可行性更加提昇?其實要去思考的

,反而是如何鼓勵使用者多產出標籤。

 

三、使用者標記詞彙深具個人色彩與主觀意涵,是零碎、模糊且隨時期變動的,原

       因就在於沒有嚴謹的控制詞彙標準,標籤所使用的語言過多、標籤隨時間不同

       造成不一致現象,導致檢索效率不佳,造成詞彙品質的落差,詞彙詳盡但缺乏

       精確性。由此可見,改善標籤的檢索性,才能使標記系統更加完善。

 

   四、運用認知或心理學的角度來探討標記的動機或行為,對於開發新興資訊服務社

       群或對於社會性標記的發展將會有極大的助益。這可能也意味著使用者透過網

       路進行資訊檢索的需求。

 

   五、使用者圖像標記的目的以利己為出發點,一方面方便個人資訊管理,一方面提

       高網站曝光率;透過叢集分類技術,實現了資源共享的利他理想國。

 

   六、不同的圖像標籤看到新社會現象

       從網路社群的這些標籤,人們學習到許多趨勢上的變化文化現象上的流動。當

       標籤的制定不再來自於專家學者,而來自於各地的網路使用者,此時就已打破

       了過去的傳統分類模式。社群如何描述各式各樣的網路內容,顯示這都是未來

       的新興趨勢或是語言、語意的演化。

 

伍、後續研究與建議

   一、標籤來源可以多方取自各大型書籤網站(Del.icio.usHEMiDEMiYahoo!

       享書籤)進行比較分析。

 

二、針對各個標籤系統找尋該系統的使用者進行訪談或問卷調查,以了解不同網路

社群之間使用者圖像標記的情形,提高研究的延展性與嚴謹性。

 

三、想要精確的了解使用者對於圖像資訊的理解與詮釋,可設計遊戲系統隨機讓兩

       組使用者同時針對同一組圖像進行標籤註記,不但具有趣味性亦可讓使用者有

       成就感與競爭感,對於圖像理解的資訊也經由遊戲完整的被記錄下來。

    一位卡內基梅隆大學畢業的Luis von Ahn,他所設計的ESP Game就是利用遊戲

    取得了有意義的資料,而這些經由理解產生的圖像關鍵字,也可用來訓練電腦

    來辨識圖片的內容物,簡直是一舉數得。但目前僅止於英文標籤的輸入,中文

    部分尚未問世,如此取得標籤的方式,資料量必定比書籤網站來得豐富。

 

 

參考文獻

中文部份

卜小蝶(2007)Web2.0Library2.0簡介。國立成功大學圖書館館刊,168-14

周冠中,郭美懿(2000)e-business 時代風潮,台北市:博碩出版社。

于文強(2008)。部落格行銷:企業網路行銷的最後一哩(上),數位時代,檢自

      http://www.emailcash.com.tw/

卜小蝶(2007)Folksonomy 的發展與應用。國立成功大學圖書館館刊,161-7

卜小蝶(2002)。使用者導向之圖書分類關聯分析研究。圖書資訊學刊,781-94

PuichingWiki(2008)Flickr簡介。澳門培正中學首頁。檢自

      http://e-service.puiching.edu.mo/wiki/index.php/Flickr

楊雅婷(2006)。網路資源使用者之標記行為研究:以社會性書籤系統為例。世新大學

      資訊傳播學研究所碩士論文。

卜小蝶 (2006) 。「淺談社會性標記之意涵與應用」。 Web2.0 與圖書館研討會論文集,

      Retrieved Mar, 15, from

      http://www.lib.tku.edu.tw/libintro/pub/web20&lib_semina/social_tag_ft.pdf

Tiger(2006)Tagging正升高成全面主流。兩隻老虎Blog。檢自

      http://2tigers.net/blog/2006/05/27/tagging-goes-mainstream/

神曉玲(1996)。圖像意境蒐尋系統之設計與實作。國立台灣大學資訊工程學研究所碩士

      論文。

張瀚文(1999)。圖像資訊之描述與分析。大學圖書館3卷,1104-115

 

西文部份

Golder, S.A. and Huberman, B.A. (2006). Usage patterns of collaborative tagging systems.

      Journal of Information Science 32(2), 198-208.

Marlow, C., Naaman, M., and boyd, D. (2006). HT06, tagging paper, taxonomy, Flickr,

      academic article, Hypertext06. Available:

      http://www.danah.org/papers/Hypertext2006.pdf

Ross Mayfield (2005).Technorati Takes Tags Global.

Shatford Layne, S (1986). Analyzing the subject of a picture: a theoretical approach.

      Cataloguing and Classification Quarterly, 5(3), 39-61.

Sinha, R. (2006). A cognitive analysis of tagging. Retrieved Jan. 10, 2007, from

      http://www.rashmisinha.com/archives/05_09/tagging-cognitive.html

Sen, S., Lam S. K., Rashid, A. M., Cosley, D., Frankowski, D., Osterhouse, J., Harper, F. M.,

      and Riedl, J. (2006). Tagging, communities, vocabulary, evolution. Proceedings of the

     20th Anniversary Conference on Computer Supported Cooperative Work, November

     4-8, 2006, Banff, Alberta, Canada. Retrieved July, 25, 2006, from

     http://www-users.cs.umn.edu/~cosley/research/papers/sen-cscw2006.pdf

Trant, J. and Wyman, B. (2006). Investigating social tagging and folksonomy in art museums

     with steve.museum. WWW 2006. Available:

     http://www.rawsugar.com/www2006/4.pdf

Tapscott, D., & Williams, A. D. (2006). Wikinomics: How mass collaboration changes

     everything. New York: Portfolio.