首先,來說一下做站為什么要講心態(tài),冰凍三尺,非一日之寒。凡事都有其規(guī)律和過程,急不得。最可惜的是在勝利的前夜撤退。這些撤退的人往往是沒有意識(shí)到事物的正常規(guī)律,錯(cuò)誤判斷了形勢。比如短期獲利和長期發(fā)展的取舍,就是一個(gè)大家經(jīng)常會(huì)遇到的問題。什么叫短期獲利,比如放彈窗,幫人掛馬……這些短時(shí)間都挺賺錢,又或者是在論壇過度做廣告,短期內(nèi)流量也會(huì)上來很多。但是過后呢?經(jīng)常是一個(gè)站就這樣廢掉了。
許多人忙忙碌碌好幾年,發(fā)現(xiàn)自己沒有做成一個(gè)站。而一些比自己做站晚的,所謂很笨的站長,反而成功了,就是心態(tài)的差別。但是另一個(gè)極端就是過于求大。好多人做站,上來就弄服務(wù)器,甚至請專職技術(shù)、專職美工來幫忙。但我覺得除非本身就財(cái)大氣粗,剛開始做站是不宜投資過大的。初期除了域名其他都可以免費(fèi)或低價(jià)湊合。前幾天在參加應(yīng)老K邀請參與的5.16高端站長聚會(huì)上認(rèn)識(shí)的小邪,他的小說站每天pv2000萬。但他剛做站時(shí),就是很多空間拼起來用的。順便講講什么是做站的核心資源。域名和數(shù)據(jù)是核心資源,千萬不能丟。但是域名不一定用太好的,站好比域名好值錢。不宜盲目追求過于貴的域名。
一個(gè)好的域名可以帶來很大的天然流量,也方便網(wǎng)友記憶,甚至是企業(yè)品牌和實(shí)力的象征。但在265的同事中,也有和老蔡持不同意見的人。他們認(rèn)為許多網(wǎng)民根本不記憶域名,往往是用收藏夾來存網(wǎng)站的。我現(xiàn)在的想法是,在中國做站,域名不能太難記,如果用一長串英文或者無意義的字母,不利于推廣。但是要認(rèn)識(shí)到相當(dāng)多的網(wǎng)民喜歡用收藏夾。因此,不管自己域名好不好,都要大力鼓勵(lì)用戶收藏自己的網(wǎng)站。普通的站,你即使用技術(shù)手段讓用戶設(shè)為主頁,用戶也會(huì)改掉。但是,你讓他收藏,如果他覺得你的站確有特色,是不會(huì)反感的。
我05年開始做站的,當(dāng)時(shí)已經(jīng)沒什么好域名可注冊了。域名大佬們說2000年前好米就被注冊光了。我當(dāng)時(shí)就注冊了幾個(gè)比較長的拼音域名,有十幾個(gè)字母吧。有人就說你的域名太長了,不好。但是后來無意中發(fā)現(xiàn),拼音域名在和你域名同音的關(guān)鍵詞上權(quán)重特別高。這其實(shí)是百度和谷歌在中文搜索方面的技術(shù)競爭造成的,對網(wǎng)民是好事,對站長更是好事。因?yàn)槿绻阕圆坏剑蛘哔I不起特別短的域名,你可以注冊個(gè)拼音域名,一樣好用,好記。這是中國特色,老外不懂拼音,我們還有機(jī)會(huì)選到好的域名。
說完域名,我們談?wù)剶?shù)據(jù)的重要性。數(shù)據(jù)一定要定期備份,不然發(fā)展越快,損失越大。這是我的教訓(xùn),大家一定要記住。我最早的網(wǎng)站是放在一個(gè)朋友的空間里。我朋友在電信局,我認(rèn)為電信的服務(wù)器肯定不會(huì)出錯(cuò)。所以沒有經(jīng)常備份。后來有一次,我突然發(fā)現(xiàn)網(wǎng)站打不開了。然后上ftp一會(huì)能上,一會(huì)兒不能上。我沒在意,以為是網(wǎng)絡(luò)故障第二天,我那朋友告訴我,我用的空間所在的服務(wù)器硬盤壞了。當(dāng)時(shí)萬幸的是我比較大的一個(gè)站已經(jīng)放在自己托管的服務(wù)器上了,損失的主要是個(gè)人主頁和博客的數(shù)據(jù)。后來,我花了幾個(gè)晚上通過百度快照等,才把博客內(nèi)容恢復(fù)了。大家在選擇空間時(shí),也要問清楚空間商提不提供定期備份,如果沒有,就自己定期手工備份。
數(shù)據(jù)說完了,我們說說采集還是人肉的選擇。人肉就是人肉更新,即手工更新。經(jīng)常有站長說自己采集了幾百萬條數(shù)據(jù),收錄增加了多少,錢賺了多少。我們也經(jīng)常會(huì)看到什么自動(dòng)采集,自動(dòng)設(shè)關(guān)鍵字,自動(dòng)更新的軟件廣告。那些采集軟件也就幾百塊,每個(gè)人咬咬牙就能買一套。但是采集是萬能的嗎?如果大家都采集了,互聯(lián)網(wǎng)上就是不斷循環(huán)的有限重復(fù)內(nèi)容了。我曾經(jīng)在幾家門戶網(wǎng)站做過編輯。最初,是大家爭著上采集系統(tǒng),以增大新聞量,減輕編輯的勞動(dòng)壓力。但是,我了解到,多家門戶一度使用非常先進(jìn)的采集系統(tǒng),現(xiàn)在回過頭拋棄了采集,開始讓編輯手發(fā)。為什么?因?yàn)樗阉饕嬉呀?jīng)能識(shí)破大多數(shù)機(jī)器采集的特征,無論谷歌還是百度都喜歡原創(chuàng)的,去重,是百度的核心規(guī)則。
我有個(gè)朋友搞過搜索引擎相關(guān)的技術(shù),他告訴我,搜索引擎是會(huì)判斷文章的原創(chuàng)“指紋”的。比如老k原創(chuàng)了一篇博客,我采集過來,替換了一些關(guān)鍵字。百度和谷歌還是能認(rèn)出來我是抄老k的,為什么?因?yàn)橹讣y沒有變。而且,人肉(手工更新)還有一個(gè)好處,就是內(nèi)容質(zhì)量的把握。機(jī)器采集的話,符合規(guī)則的都抓過來,人工更新,對于文章優(yōu)劣是有基本的判斷的。大家在上網(wǎng)時(shí),對于哪個(gè)站是采集的還是人肉的,相信很多時(shí)間自己就能感覺出來。另外,在中國做站,有一些地方特色,比如哪些內(nèi)容不能發(fā)。這些敏感內(nèi)容僅靠關(guān)鍵詞過濾是不夠的,不如人工更新來得安全。比如一張圖片是否低俗,是否露點(diǎn),機(jī)器識(shí)別不出來。有這類的軟件,但識(shí)別率不高,無法應(yīng)用于采集。即使是要采集,建議大家先采集入庫,再人工審核。這樣兼顧了效率與質(zhì)量。