Aug 27 2008

中国公民赴埃及须知

Category: 乱up当秘笈ssmax @ 20:54:14

转自中华人民共和国外交部

http://www.fmprc.gov.cn/chn/wjb/zzjg/xybfs/gjlb/1359/1359×3/t162825.htm

  (本栏目内容系外交部网站版权所有,任何单位或个人,未经协议授权,严禁下载使用。如需转载,请注明信息来源,并保证信息的完整,禁止对信息进行随意删改。本网站对任何侵权行为保留诉诸法律的权利。)

  一、 特别提醒

  (一)埃及是伊斯兰国家,应注意尊重当地宗教和风俗习惯。女性不

  要穿过于暴露的衣服,在公共场合男女间不要有拥抱等亲密举动。

  (二)埃及不禁酒,但不宜在公共场所饮烈性酒。

  (三)禁止在政府机关、军事设施等敏感地区拍照摄影。未经本人许

  可,不得给妇女拍照。

在清真寺、博物馆里拍摄要事先征得同意。

 

  (四)注意饮食卫生,最好不要购买街边小吃。不要携带猪肉制品。

  (五)给小费在埃及很普遍,一般对服务员、导游、司机要付小费。

  二、 签证、入境与海关

  (一)、签证须知

  (1)申办程序

  外国公民持有效护照可向埃及驻外外交或领事机构申办签证,也

  可向埃及移民局入境签证处申请。

  (2)签证种类

  旅游签证:一次或多次入出境,有效期三个月。

  入境签证:发给赴埃工作、学习的外国公民,以便其办理在埃及

  的长期居留签证。

  过境签证:有效期7天。

  (二)、入境须知

  (1)埃及政府严禁毒品入境,违者将予处罚;情节严重者,处罚

  金50万埃镑,或终身监禁,或处以极刑。

  (2)开罗国际机场入、出境通道分红色(需海关申报)和绿色

  (无需海关申报)两种。

  (3)出、入境旅客最多可随身携带1000埃镑。

  (三)、海关规定

  入境旅客可携带下述免税物品:

  (1)个人服装。

  (2)一公升酒精饮料、一公升香水、200支吞烟、25只雪茄或200

  克烟草。

  (3)参加国际比赛获得的勋章、奖牌和奖品。

  (4)相机、打字机、计算器、收音机、录音机、摄像机、个人珠

  宝和首饰等物品,上述物品须在入境时办理有关海关手续;持有人离

  境时,若上述物品滞留埃及,将以走私罪论处。

  (5)外交人员,公费或外国资助留学人员,自费学者,其个人财

  物、药品、家具、汽车入境时享受免税。

  (6)旅客在入境24小时内,可在免税商店购买200美元以内的免税商

  品。

  三、 安全形势与治安状况

  埃及国家政局稳定,社会治安较好,犯罪率比较低。为维护社会治

  安,埃及各城镇,特别是首都各旅游景点,均有宪兵、旅游警察、便

  衣警察、保安及安全部门派出的工作人员值勤。各星级饭店、商场、

  旅游景点等入口处均设有安检门,防范措施严密。尽管如此,埃及还

  是存在恐怖袭击的危险,因此特别提醒赴埃及的中国公民注意安全,外

  出最好随团行动。

  为确保财产和人身安全,建议:

  (一)外出旅行应携带护照及有效身份证件、住地地址和联系电

  话等;

  (二)外出时,现金和贵重物品最好存入酒店的保险箱或酒店指

  定地点;

  (三)乘坐飞机,勿将护照、现金或贵重物品随行李托运;

  (四)晚上外出活动,最好结伴而行,回酒店不宜太晚;

  四、 常见疾病与医疗状况

  (一)医疗条件

  埃及政府重视医疗服务,积极改善和发展公共医疗、应急预防和救护

  措施。埃及拥有220多所综合性医院和中心医院,33800多张床位,乡

  村医院200多所,床位5400张。全国医药商店35100家。拥有国家级和

  卫生部级医生180951名,牙科医生15900名,国家级护理人员141700

  名。埃及常见药品供应充足,价格适中,在各大医院和药房都能买

  到。

  (二)医疗保险

  根据法律规定,所有公民均应加入社会保障和公共医疗保险,以

  保障公民和家庭免受失业、退休、疾病和死亡造成的损失。

  社会保险费的交纳比例为:月薪在625埃镑以内的固定职业者交纳,超过625埃镑者交纳11%;无固定职业者每月交纳l埃镑。

  14%

  (三)禽流感的防控

  自埃及出现禽流感以来,政府有关部门采取了一切可行的措施控制疫

  情的蔓延。这些措施包括禁止在没有政府许可证的地点宰杀禽类、关

  闭首都开罗和其他7个城市的国家动物园、进一步加强对禽类的检疫,

  以及宣布取消一年一度的猎鸟季节以减少候鸟与人之间接触的可能

  性。目前,埃及的禽流感疫情已得到有效控制,禽类产品的供应基本

  恢复正常。

  五、 当地风俗与法规

  每星期五是“主麻日聚礼”,当清真寺内传出悠扬的唤礼声,伊斯兰

  教徒便纷纷涌向附近的清真寺,做集体礼拜。为数众多的教徒仍然虔

  诚地信守每日5次礼拜的教规:即晨礼、响礼、哺礼、昏礼、宵礼。每

  逢宗教节日,电视还播放总统及政府首脑去清真寺礼拜的镜头。

  埃及大多信奉伊斯兰教。他们绝对禁食自死物、血液和猪肉,以及非

  诵真主之名而宰的动物,也禁止使用猪制品。

  按伊斯兰教义,妇女的“迷人之处”是不能让丈夫以外人窥见的。即

  使是同性之间,也不应相互观看对方的私处,因此,短、薄、透、露

  的服装是禁止的。

  埃及人认为“右比左好”,右是吉祥的,做事要从右手和右脚开始,

  握手、用餐、递送东西必须用右手,用左手与他人握手或递东西是极

  不礼貌的。

  通常在埃及人面前尽量不要打哈欠或打喷嚏,如果实在控制不住,应

  转脸捂嘴,并说声“对不起”。

  埃及人对绿色和白色都有很深的感情。一般人都厚爱这两种颜色。有

  把绿色喻为吉祥之色,把白色视为“快乐”之色的说法。讨厌黑色和

  蓝色。

  埃及人宠猫、敬猫如神,并视猫为神圣的精灵。在埃及人的心目中,

  猫是女神在人间的象征,是幸运的吉祥物,是受人崇敬的国兽。

  六、 物价与供应

  埃及常用物品供应充足,物价比国内稍贵,当地货币埃镑与人民币的

  比值为1:1.4。

  赴埃旅游建议携带:防晒用品、长袖衣服和长裤、常用药品、牙刷牙

  膏和拖鞋、插头转换器(埃及使用圆型双头插座)、清凉油等小礼品

  七、 交通与出行

  (一)气候和交通状况

  尼罗河三角洲和北部沿海地区属亚热带地中海型气候,其余大部分地

  区属热带沙漠气候。开罗地区年降雨量约18毫米,夏季平均气温最高

  为34.2℃,最低20.8℃,冬季气温最高为19.9℃,最低9.7℃;地中海

  沿岸城市亚历山大年平均降雨量约200毫米;南方地区夏季平均气温最

  高为42℃,最低气温20.8℃,冬季平均气温最高为25.8℃,最低气温月间常有“五旬

  9.6℃;早晚温差较大。埃及有沙尘暴,每年4-5

  风”,夹带沙石,破坏农作物的生长。

  开罗的交通设施较为老旧,交通次序比较混乱,游客外出注意交通安

  全。开罗主要交通工具有出租车、公交车和地铁,公交车路过站牌一

  般只减速不停车,乘客需爬飞车上下,很不安全,建议游人不要尝

  试。

  北京到开罗有直达航班,也可选择经巴林、迪拜、伊斯坦布尔或巴黎

  转机赴开罗。开罗机场位于市区东北25公里处,30-50分钟车程,坐出

  租车40埃镑左右。

  (二)主要旅游城市及景点

  开罗:金字塔、埃及博物馆、哈利里市场、古城堡、尼罗河

  亚历山大:夏宫、卡特巴城堡、孔姆地卡

  卢克索:卢克索神庙、卡尔纳克神庙、国王谷、王后谷

  阿斯旺:阿布辛贝勒神庙、菲莱神殿

  (三)开罗主要星级宾馆

  开罗的星级宾馆较多,服务也不错,主要有以下几家

  *****:Marriott Hotel   Hilton Cairo Ramses

  Mena House Hotel

  Baron Heliopolis Hotel

  Conrad International Cairo

  Four Seasons Hotel at the First

 

 

  Sheraton Hotel El Gezirah Towers & Casino

 

  Sofitel Cairo Maadi Towers and Casino :CairoTel Hotel

 

  ****

  Hormoheb Hotel

 

  Novotel Hotel Cairo Airport : Cairo Khan Hotel

 

  ***

 

  Cosmopolitan Hotel

 

  Hotel Beirut

  Victoria Hotel

 

  埃及宾馆不为客人准备牙刷和拖鞋,游客需自带。饭店内电压为,电源插口为圆型双孔,与国内不一样,需自带转换插头。

  220V

  八、工作

埃及法律规定,企业在聘用一名外籍员工的同时必须聘用十名埃

 

  及员工。因此,中国公民在埃及就业比较困难。

  九、国籍政策:

  埃及政府承认双重国籍和多重国籍,埃及公民申请外国国籍须经

  内政部部长书面同意。

  十、使馆联系方式

  (一)中国驻埃及使馆电话及传真

  值班电话:00201-22107848  传真:00202-7359459

  办公室:00202-7361219 传真:00202-7352318

  政治处:00202-7370781

  新闻处:00202-7384185 传真:00202-7363556

  领事部:00202-7362674

  武官处:00202-7351500

  经商处:00202-7363712  传真:00202-7362094

  文化处:00202-7798203  传真:00202-7798247

  科技处:00202-7356746

  教育处:00202-7359019

  中国驻亚历山大总领事馆

  领区:亚历山大、塞得港、伊斯梅里亚、苏伊士

  电话:00203-3924324  传真:00203-3906409

  塞德港办公室:002066-3238546 传真:002066-3321625

  (二)埃及常用电话

  交通警察:4825033报警电话:122

  旅游警察:3906028查号台:140/141

  机场问讯:2914255医疗急救:123

  埃航问讯:6350260煤气抢修:129

  港口问讯:3938278电力抢修:121

  (三)埃及参考网站:

  埃及外交部http://www.mfa.gov.eg

  埃及网站索引http://ce.eng.usfedu/pharos

  埃及人民议会网站http://www.parliatiient.gov.eg

  埃及人权组织http://www.eohr.org.eg

  埃及网站搜索hlttp://www.egypt.com

  埃及网站搜索http://www.egyptsearch.com

  埃及政府综合网站http://www.sis.gov.eg

  埃及政府服务网(阿文)http://www.misrnet.idsc.gov.eg

  埃及总统府网站http://www.presidency.gov.eg

  《今日埃及》杂志http://www.egypttoday.com

  《金字塔报》http://www.ahram-eg.com

  《共和国报》http://www.algomhuria.net.eg

  解放网(埃及新视点)http://news.tahrir.net

  埃及中央银行http://www.cbe.org.eg

  埃及美国银行http://www.eab-online.com

  埃及各省份http://www.ipgd.idsc.gov.eg

  埃及军队网http://www.mmc.gov.eg

  埃及指南http://egydir.soficom.com.eg

  十一、关于公证、认证

  中国公民所持埃及有关方面出具的文书(出生证明、结婚证书、

  毕业证书、营业执照等)如拟在中国使用,须到埃外交部公证认证处

  进行认证,并到大使馆领事部办理认证手续后,该文件方被中国政府

  有关部门承认有效。主要公证认证处:外交部公证认证处、穆罕迪辛

  公证认证处、艾哈迈得•塞得公证认证处等。

  中国公民持中国有关方面出具的文书(出生证明、结婚证书、毕

  业证书、营业执照等)如拟在埃及使用,须在当事人所在市级以上公

  证机关公证,并到中国外交部有关部门和埃及驻华使、领馆办理认证

  手续后,该文件才被埃及政府有关部门承认有效。

  十二、关于中国公民与埃及公民在埃及登记结婚

  (一)中国公民与埃及公民在埃司法部涉外婚姻登记处办理婚姻

  登记手续时须提交两份公证书:1、婚姻状况(未婚、离异或丧偶)公

  证书,该证书须已经中国外交部领事司或各省市人民政府外事办公室

  认证和埃及驻中国使领馆的认证;2、中国驻埃及大使馆出具的“对婚

  姻不持异议公证书”。

  (二)到中国驻埃及大使馆申办“对婚姻不持异议公证书”手续

  时,中国公民所持“婚姻状况公证书”有效期不超过六个月,根据中

  华人民共和国《婚姻法》关于一夫一妻制的规定,男方为埃及公民需

  提交已经埃外交部公证认证处认证的单身证明,有效期不超过三个

  月。


Aug 26 2008

买条内存都这么多分别

Category: 乱up当秘笈ssmax @ 17:35:14

kingstone

DDR2 667 1G 远东行货 124 定货 五年包换,终生质保  
DDR2 667 1G 原装行货 116 少量 五年包换,终生质保  
DDR2 667 1G 山寨行货 111 大量 三年包换,终生质保  
DDR2 667 1G 山寨行货 098 少量 三年包换,终生质保  
DDR2 667 1G 台湾水货 080 少量 一年包换,终生质保  
DDR2 667 1G 山寨本条 120 大量 三年包换,终生质保  

远东行货(正宗金士顿出品,独立SN,正宗代理产品)
原装行货(正宗金士顿出品,复制SN,正宗代理产品)
山寨行货(正宗金士顿出品,自设SN,正式代理产品)俗称电脑城行货
台湾水货(台湾小工厂出品,假冒SN,非代理产品)

汗啊,这就是山寨工业。。。


Aug 25 2008

Hbase 原理及性能分析报告(Hadoop,Hypertable,Bigtable)

Category: 技术ssmax @ 16:02:29

分布式文件系统和数据库

东抄一句,西抄一句,自己写点,翻译一点,就变成这个东东了,20多页,最后结论就是,尚不成熟,有待观察,前途不错。

下载:↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓

hbase 分析报告

↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑

引用文档:

The Hadoop Distributed File System: Architecture and Design
http://hadoop.apache.org/core/docs/r0.16.4/hdfs_design.html

HDFS Under the Hood Presentation 1
http://assets.en.oreilly.com/1/event/12/HDFS%20Under%20the%20Hood%20Presentation%201.pdf

Kosmos File System (KFS) is a New High End Google File System Option
http://highscalability.com/kosmos-file-system-kfs-new-high-end-google-file-system-option

Hadoop HBase Performance Evaluation Introduction
http://www.cs.duke.edu/~kcd/hadoop/kcd-hadoop-report.pdf

Hbase/HbaseArchitecture
http://wiki.apache.org/hadoop/Hbase/HbaseArchitecture

Hbase/DataModel
http://wiki.apache.org/hadoop/Hbase/DataModel

Understanding HBase and BigTable
http://jimbojw.com/wiki/index.php?title=Understanding_Hbase_and_BigTable

The End of an Architectural Era (It’s Time for a Complete Rewrite)
http://www.vldb.org/conf/2007/papers/industrial/p1150-stonebraker.pdf

HBase Leads Discuss Hadoop, BigTable and Distributed Databases
http://www.infoq.com/news/2008/04/hbase-interview

Validating the Real-time Performance of Hbase
http://wiki.apache.org/hadoop/Hbase/HbaseRTDS

Hadoop Summit and Data-Intensive Computing Symposium Videos and Slides
http://research.yahoo.com/node/2104

Google Datastore and the shift from a RDBMS
http://groovie.org/2008/04/13/google-datastore-and-the-shift-from-a-rdbms

One Size Fits All? – Part 2: Benchmarking Results
http://nms.csail.mit.edu/~stavros/pubs/osfa.pdf

Bigtable: A Distributed Storage System for Structured Data
http://labs.google.com/papers/bigtable-osdi06.pdf

Hypertable领导者:Hadoop和分布式数据库
http://www.builder.com.cn/2008/0506/847804.shtml


Aug 25 2008

奥运闭幕

Category: 乱up当秘笈ssmax @ 09:14:40

昨天看太晚了,忘记写了,16天的奥运终于落下帷幕,中国要再举办的话起码要等个20年,20年后是啥世界呢,谁知道了。。。


Aug 23 2008

跳水的梦之队

Category: 乱up当秘笈ssmax @ 22:43:03

最后被人逆转了,太郁闷了,遗憾,如果能拿到就是50金了,不知道明天还有没有机会,明天就闭幕式了,过得真是快。


Aug 22 2008

一道新菜

Category: 乱up当秘笈ssmax @ 23:57:55

西红柿炒番茄。。。愣了一下。。。


Aug 21 2008

Google Bigtable

Category: 技术ssmax @ 17:34:48

大表(Bigtable):结构化数据的分布存储系统

http://labs.google.com/papers/bigtable-osdi06.pdf
{中是译者评论,程序除外}

{本文的翻译可能有不准确的地方,详细资料请参考原文.}
摘要
bigtable是设计来分布存储大规模结构化数据的,从设计上它可以扩展到上2^50字节,分布存储在几千个普通服务器上.Google的很多项目使用BT来存储数据,包括网页查询,google earth和google金融.这些应用程序对BT的要求各不相同:数据大小(从URL到网页到卫星图象)不同,反应速度不同(从后端的大批处理到实时数据服务).对于不同的要求,BT都成功的提供了灵活高效的服务.在本文中,我们将描述BT的数据模型.这个数据模型让用户动态的控制数据的分布和结构.我们还将描述BT的设计和实现.

1.介绍

在过去两年半里,我们设计,实现并部署了BT.BT是用来分布存储和管理结构化数据的.BT的设计使它能够管理2^50 bytes(petabytes)数据,并可以部署到上千台机器上.BT完成了以下目标:应用广泛,可扩展,高性能和高可用性(high availability). 包括google analytics, google finance, orkut, personalized search, writely和google earth在内的60多个项目都使用BT.这些应用对BT的要求各不相同,有的需要高吞吐量的批处理,有的需要快速反应给用户数据.它们使用的BT集群也各不相同,有的只有几台机器,有的有上千台,能够存储2^40字节(terabytes)数据.

BT在很多地方和数据库很类似:它使用了很多数据库的实现策略.并行数据库[14]和内存数据库[13]有可扩展性和高性能,但是BT的界面不同.BT不支持完全的关系数据模型;而是为客户提供了简单的数据模型,让客户来动态控制数据的分布和格式{就是只存储字串,格式由客户来解释},并允许客户推断底层存储数据的局部性{以提高访问速度}.数据下标是行和列的名字,数据本身可以是任何字串.BT的数据是字串,没有解释{类型等}.客户会在把各种结构或者半结构化的数据串行化{比如说日期串}到数据中.通过仔细选择数据表示,客户可以控制数据的局部化.最后,可以使用BT模式来控制数据是放在内存里还是在硬盘上.{就是说用模式,你可以把数据放在离应用最近的地方.毕竟程序在一个时间只用到一块数据.在体系结构里,就是:locality, locality, locality}

第二节描述数据模型细节.第三节关于客户API概述.第四节简介BT依赖的google框架.第五节描述BT的实现关键部分.第6节叙述提高BT性能的一些调整.第7节提供BT性能的数据.在第8节,我们提供BT的几个使用例子,第9节是经验教训.在第10节,我们列出相关研究.最后是我们的结论.

2.数据模型
BT是一个稀疏的,长期存储的{存在硬盘上},多维度的,排序的映射表.这张表的索引是行关键字,列关键字和时间戳.每个值是一个不解释的字符数组.{数据都是字符串,没类型,客户要解释就自力更生吧}

(row:string, column:string,time:int64)->string {能编程序的都能读懂,不翻译了}

//彼岸翻译的第二节

我们仔细查看过好些类似bigtable的系统之后定下了这个数据模型。举一个具体例子(它促使我们做出某些设计决定), 比如我们想要存储大量网页及相关信息,以用于很多不同的项目;我们姑且叫它Webtable。在Webtable里,我们将用URL作为行关键字,用网页的某些属性作为列名,把网页内容存在contents:列中并用获取该网页的时间戳作为标识,如图一所示。

Photobucket - Video and Image Hosting

图一:一个存储Web网页的范例列表片断。行名是一个反向URL{即com.cnn.www}。contents列族{原文用 family,译为族,详见列族}存放网页内容,anchor列族存放引用该网页的锚链接文本。CNN的主页被Sports Illustrater{即所谓SI,CNN的王牌体育节目}和MY-look的主页引用,因此该行包含了名叫“anchor:cnnsi.com”和 “anchhor:my.look.ca”的列。每个锚链接只有一个版本{由时间戳标识,如t9,t8};而contents列则有三个版本,分别由时间 戳t3,t5,和t6标识。

表中的行关键字可以是任意字符串(目前支持最多64KB,多数情况下10-100字节足够了)。在一个行关键字下的每一个读写操作都是原子操作(不管读写这一行里多少个不同列),这是一个设计决定,这样在对同一行进行并发操作时,用户对于系统行为更容易理解和掌控。

Bigtable通过行关键字的字典序来维护数据。一张表可以动态划分成多个连续行。连续行在这里叫做“子表”{tablet},是数据分布和负载均衡的单位。这样一来,读较少的连续行就比较有效率,通常只需要较少机器之间的通信即可。用户可以利用这个属性来选择行关键字,从而达到较好数据访问地域性{locality}。举例来说,在Webtable里,通过反转URL中主机名的方式,可以把同一个域名下的网页组织成连续行。具体来说,可以把maps.google.com/index.html中的数据存放在关键字com.google.maps/index.html下。按照相同或属性相近的域名来存放网页可以让基于主机和基于域名的分析更加有效。

列族

一组列关键字组成了“列族”,这是访问控制的基本单位。同一列族下存放的所有数据通常都是同一类型(同一列族下的数据可压缩在一起)。列族必须先创建,然后在能在其中的列关键字下存放数据;列族创建后,族中任何一个列关键字均可使用。我们希望,一张表中的不同列族不能太多(最多几百个),并且列族在运作中绝少改变。作为对比,一张表可以有无限列。

列关键字用如下语法命名:列族:限定词。 列族名必须是看得懂{printable}的字串,而限定词可以是任意字符串。比如,Webtable可以有个列族叫language,存放撰写网页的语言。我们在language列族中只用一个列关键字,用来存放每个网页的语言标识符。该表的另一个有用的列族是anchor;给列族的每一个列关键字代表一个锚链接,如图一所示。而这里的限定词则是引用该网页的站点名;表中一个表项存放的是链接文本。

访问控制,磁盘使用统计,内存使用统计,均可在列族这个层面进行。在Webtable举例中,我们可以用这些控制来管理不同应用:有的应用添加新的基本数据,有的读取基本数据并创建引申的列族,有的则只能浏览数据(甚至可能因为隐私权原因不能浏览所有数据)。

时间戳

Bigtable表中每一个表项都可以包含同一数据的多个版本,由时间戳来索引。Bigtable的时间戳是64位整型。可以由Bigtable来赋值,表示准确到毫秒的“实时”;或者由用户应用程序来赋值。需要避免冲突的应用程序必须自己产生具有唯一性的时间戳。不同版本的表项内容按时间戳倒序排列,即最新的排在前面。

为了简化对于不同数据版本的数据的管理,我们对每一个列族支持两个设定,以便于Bigtable对表项的版本自动进行垃圾清除。用户可以指明只保留表项的最后n个版本,或者只保留足够新的版本(比如,只保留最近7天的内容)。

在Webtable举例中,我们在contents:列中存放确切爬行一个网页的时间戳。如上所述的垃圾清除机制可以让我们只保留每个网页的最近三个版本。

//我开始翻译3,4节 

3.API
BT的API提供了建立和删除表和列族的函数.还提供了函数来修改集群,表和列族的元数据,比如说访问权限.

// Open the table
Table *T = OpenOrDie(”/bigtable/web/webtable”);
// Write a new anchor and delete an old anchor
RowMutation r1(T, “com.cnn.www”);
r1.Set(”anchor:www.c-span.org”, “CNN”);
r1.Delete(”anchor:www.abc.com”);
Operation op;
Apply(&op, &r1);
图 2: 写入Bigtable.

在BT中,客户应用可以写或者删除值,从每个行中找值,或者遍历一个表中的数据子集.图2的C++代码是使用RowMutation抽象表示来进行一系列的更新(为保证代码精简,没有包括无关的细节).调用Apply函数,就对Webtable进行了一个原子修改:它为http://www.cnn.com/增加了一个锚点,并删除了另外一个锚点.

Scanner scanner(T);
ScanStream *stream;
stream = scanner.FetchColumnFamily(”anchor”);
stream->SetReturnAllVersions();
scanner.Lookup(”com.cnn.www”);
for (; !stream->Done(); stream->Next()) {
printf(”%s %s %lld %s\n”,
scanner.RowName(),
stream->ColumnName(),
stream->MicroTimestamp(),
stream->Value());
}
图3: 从Bigtable读数据.

图3的C++代码是使用Scanner抽象来遍历一个行内的所有锚点.客户可以遍历多个列族.有很多方法可以限制一次扫描中产生的行,列和时间戳.例如,我们可以限制上面的扫描,让它只找到那些匹配正则表达式*.cnn.com的锚点,或者那些时间戳在当前时间前10天的锚点.

BT还支持其他一些更复杂的处理数据的功能.首先,BT支持单行处理.这个功能可以用来对存储在一个行关键字下的数据进行原子的读-修改-写操作.BT目前不支持跨行关键字的处理,但是它有一个界面,可以用来让客户进行批量的跨行关键字处理操作.其次,BT允许把每个表项用做整数记数器.最后,BT支持在服务器的地址空间内执行客户端提供的脚本程序.脚本程序的语言是google开发的Sawzall[28]数据处理语言.目前,我们基于的Sawzall的API还不允许客户脚本程序向BT内写数据,但是它允许多种形式的数据变换,基于任何表达式的过滤和通过多种操作符的摘要.

BT可以和MapReduce[12]一起使用.MapReduce是google开发的大规模并行计算框架.我们为编写了一套外层程序,使BT可以作为MapReduce处理的数据源头和输出结果.

4.建立BT的基本单元
BT是建立在其他数个google框架单元上的.BT使用google分布式文件系统(GFS)[17]来存储日志和数据文件{yeah, right, what else can it use, FAT32?}.一个BT集群通常在一个共享的机器池中工作,池中的机器还运行其他的分布式应用{虽然机器便宜的跟白菜似的,可是一样要运行多个程序,命苦的象小白菜},BT和其他程序共享机器{BT的瓶颈是IO/内存,可以和CPU要求高的程序并存}.BT依赖集群管理系统来安排工作,在共享的机器上管理资源,处理失效机器并监视机器状态{典型的server farm结构,BT是上面的应用之一}

BT内部存储数据的格式是google SSTable格式.一个SSTable提供一个从关键字到值的映射,关键字和值都可以是任意字符串.映射是排序的,存储的{不会因为掉电而丢失},不可改写的.可以进行以下操作:查询和一个关键字相关的值;或者根据给出的关键字范围遍历所有的关键字和值.在内部,每个SSTable包含一列数据块(通常每个块的大小是64KB,但是大小是可以配置的{索引大小是16 bits,应该是比较好的一个数}).块索引(存储在SSTable的最后)用来定位数据块;当打开SSTable的时候,索引被读入内存{性能}.每次查找都可以用一个硬盘搜索完成{根据索引算出数据在哪个道上,一个块应该不会跨两个道,没必要省那么点空间}:首先在内存中的索引里进行二分查找找到数据块的位置,然后再从硬盘读去数据块.最佳情况是:整个SSTable可以被放在内存里,这样一来就不必访问硬盘了.{想的美,前面是谁口口声声说要跟别人共享机器来着?你把内存占满了别人上哪睡去?}

BT还依赖一个高度可用的,存储的分布式数据锁服务Chubby[8]{看你怎么把这个high performance给说圆喽}.一个Chubby服务由5个活的备份{机器}构成,其中一个被这些备份选成主备份,并且处理请求.这个服务只有在大多数备份都活着并且互相通信的时候才是活的{绕口令?去看原文吧,是在有出错的前提下的冗余算法}.当有机器失效的时候,Chubby使用Paxos算法[9,23]来保证备份的一致性{这个问题还是比较复杂的,建议去看引文了解一下问题本身}.Chubby提供了一个名字空间,里面包括了目录和小文件{万变不离其宗}.每个目录或者文件可以当成一个锁来用,读写文件操作都是原子化的.Chubby客户端的程序库提供了对Chubby文件的一致性缓存{究竟是提高性能还是降低性能?如果访问是分布的,就是提高性能}.每个Chubby客户维护一个和Chubby服务的会话.如果一个客户不能在一定时间内更新它的会话,这个会话就过期失效了{还是针对大server farm里机器失效的频率设计的}.当一个会话失效时,其拥有的锁和打开的文件句柄都失效{根本设计原则:失效时回到安全状态}.Chubby客户可以在文件和目录上登记回调函数,以获得改变或者会话过期的通知.{翻到这里,有没有人闻到java的味道了?}

BT使用Chubby来做以下几个任务:保证任何时间最多只有一个活跃的主备份;来存储BT数据的启动位置(参考5.1节);发现小表(tablet)服务器,并完成tablet服务器消亡的善后(5.2节);存储BT数据的模式信息(每张表的列信息);以及存储访问权限列表.如果有相当长的时间Chubby不能访问,BT就也不能访问了{任何系统都有其弱点}.最近我们在使用11个Chubby服务实例的14个BT集群中度量了这个效果,由于Chubby不能访问而导致BT中部分数据不能访问的平均百分比是0.0047%,这里Chubby不能访问的原因是Chubby本身失效或者网络问题.单个集群里,受影响最大的百分比是0.0326%{基于文件系统的Chubby还是很稳定的}.

5.实现
BT的实现有三个主要组件:客户程序库,一个主服务器和多个子表服务器.针对负载的变化,可以动态的从服务器群中添加(或者去除)子表服务器.主服务器的任务是:给子表服务器指定子表,检测加入或者失效的子表服务器,子表服务器负载均衡,以及对google文件系统的文件进行垃圾收集.除此之外,它还处理诸如建立表和列族之类的表模式改变工作.

每个子表服务器管理一个子表集合(通常每个服务器处理数十乃至上千个子表).子表服务器负责处理对它管理的子表进行的读写操作,当子表变的太大时,服务器会将子表分割.和很多单个主服务器分布式系统[17.21]一样,客户数据不经过主服务器.客户的读写操作是通过直接和子表服务器通信完成的.由于BT的客户不必通过主服务器获取子表位置信息,大多数客户完全不和主服务器通信.因此,实际使用中主服务器的负载很轻.

一个BT集群存储多个表.每个表由一些子表组成,每个子表包含一个行域内的所有数据.在起始状态下,一个表只有一个子表.当一个表长大以后,它自动的分割成多个子表,每个子表的缺省大小是100到200MB.

5.1 子表的地址

子表地址信息是存储在一个三层类似B+树[10]的结构中的(图4).

 fig4.JPG

图4:子表地址结构

第一层是Chubby中的一个文件,它存储根子表的地址.根子表里存储一个特殊的表里的所有子表的地址,地址这个特殊的表是元数据表.每个元数据子表里存储一组用户子表的地址.根子表其实是元数据表里的第一个子表,但是对它的处理比较特殊:根子表永远不会被分割,这样一来保证了子表地址结构不会超过三层.

元数据表里面,每个子表的地址都对应一个行关键字,这个关键字是由子表所在的表的标识符,和子表的最后一行编码而成的.每个元数据行在内存里存储大约1kb的数据.元数据子表的大小限制是128MB,限制看似不大,不过已经可以让这个三层的地址树足够表示2^34个子表了(如果每个子表存储128MB数据,一共是2^61字节数据).

客户程序库缓存了子表地址.如果客户没有一个子表的地址,或者它发现地址不正确,客户就递归的查询子表地址树.如果缓存是空的,那么寻址算法需要三次网络来回通信来寻址,其中包括一次Chubby读操作.如果缓存数据过期,那么寻址算法可能最多需要6次网络来回通信才能更新数据,因为只有在缓存不命中的时候才能发现数据过期{三次通信发现过期,另外三次更新数据}(这里的假定是,元数据子表没有频繁的移动).子表的地址是放在内存里的,所以不必访问google文件系统GFS,我们通过预取子表地址来进一步的减少了访问开销{体系结构里的老花招:缓存,预取}:每次读取子表的元数据的时候,都读取几个子表的元数据{为什么不说预取几个子表地址?俩?四个?这里就是有价值的东西了,需要时间去积累经验}.

在元数据表中还存储了次要信息,包括每个子表的事件日志(例如,什么时候一个服务器开始服务该子表).这些信息有助于排错和性能分析{一笔代过重要信息,比如都存了什么事件,事件属性是什么等}.

5.2子表分配

在任一时刻,一个子表只会分配给一个子表服务器.主服务器知道当前有哪些活跃的子表服务器,还知道哪些子表分配到哪些子表服务器,哪些以及哪些子表没有被分配.当一个子表没有被分配到服务器,同时又有一个服务器的空闲空间足够装载该子表,主服务器就给这个子表服务器材发送一个装载请求,把子表分配给这个服务器.

{这里是协议描述}BT使用Chubby来追踪子表服务器.当一个子表服务器启动时,它在一个特定的Chubby目录里建立一个有唯一名字的文件,并获取该文件的独占的锁.主服务器监视这个目录{服务器目录},就可以发现新的子表服务器.一个子表服务器如果丧失了对文件的锁,就停止对它的子表们的服务.服务器可能丧失锁的原因很多,例如:网络断开导致服务器丢失了Chubby会话(Chubby提供一种有效的服务,使子表服务器不必通过网络就能查询它是否还拥有文件锁{这个比较神,难道是tablet server自己只查本地文件,chubby server来帮它在本地建立文件?要认真看看chubby的协议才知道}).如果文件依然存在,子表服务器会试图重新获得对文件的独占锁.如果文件不存在了,那么子表服务器就不能服务了,它就退出.当子表服务器终止时(例如,集群管理系统将子表服务器的机器从集群中移除),它会试图释放文件锁,这样一来主服务器就能更快的把子表分配给其他服务器.

当一个子表服务器不再服务它的子表的时候,主服务器有责任发现问题,并把子表尽快重新分配.主服务器发现问题的方法是定期询问子表服务器的文件锁状态.如果一个子表服务器报告丢失了文件锁,或者过去几次询问都没有反应,主服务器就会试图获取子表服务器的文件锁.如果主服务器能够获取锁,说明Chubby是好的,子表服务器或者是死了,或者不能和Chubby通信,主服务器就删除子表服务器的文件,以确保子表服务器不再服务子表.一旦一个服务器的文件被删除,主服务器就可以把它的子表都放入未分配的子表集合中.为了保证在主服务器和Chubby之间有网络故障的时候BT仍然可以使用,主服务器的Chubby会话一旦过期,主服务器就退出.但是,如前所述,主服务器故障不影响子表到子表服务器的分配.

当一个集群管理系统启动一个主服务器时,它需要发现当前的子表分配状态,然后才能修改分配状态{设计思想:永远考虑失效+恢复}.主服务器执行以下启动步骤:(1)主服务器在Chubby中获取唯一的主文件锁,来阻止其他主服务器实例{singlton}.(2)主服务器材扫描Chubby服务器目录,获取当前活跃服务器列表.(3)主服务器和活跃子表服务器通信,获取子表分配状态{注意子表分配不是主服务器存储的,保证了失效时主服务器不会成为性能瓶颈}.(4)主服务器扫描元数据表,每次遇到一个没有分配的子表,就加入未分配子表集合,这个子表就可以被分配了.

这里有一个复杂的情况:在元数据表没有被分配之前,是不能扫描元数据表的{鸡和蛋}.因此,在开始第四步的扫描之前,如果第三步的扫描没有发现根子表没分配,主服务器就把根子表加入未分配的子表集合.这一附加步骤保证了根子表肯定会被分配.由于根子表包括了所有元数据子表的名字,主服务器在扫描过根子表以后,就知道了所有的元数据子表.

现存子表集合仅在以下事件中才会改变:一个子表被建立或者删除,两个子表被合并,或者一个子表被分割成两个.主服务器可以监控所有这些事件,因为前三个事件都是主服务器启动的.最后一个事件:分割子表,是由子表服务器启动的.这个事件是特别处理的.子表服务器在分割完毕时,在元数据表中记录新的子表的信息.当分割完成时,子表服务器通知主服务器.如果分割的通知没有到达(两个服务器中间死了一个),主服务器在请求子表服务器装载已经分割的子表的时候,就会发现这个没有通知的分割操作{设计的时候一定要考虑到错误和失败的恢复.古人云,未思进,先思退}.子表服务器就会重新通知主服务器,因为在元数据表中找到的子表入口只包含要求装载的子表的部分信息{细节,细节呢?}

//今天比较忙,只有这些了.抱歉.

//更新:彼岸翻译了第5章的剩余部分,贴在这里:

5.3 子表服务

Bigtable_Figure5.jpg
图5:子表表示

子表的状态存放在GFS里,如图5所示。更新内容提交到存放redo记录的提交日志里{比较绕,看原文可能清楚点}。在这些更新中,最近提交的那些存放在内存里一个叫memtable的有序缓冲里;老一点的更新则存放在一系列SSTable里。若要恢复一个子表,子表服务器从METADATA表中读取元数据。元数据包括了由一个子表和一系列redo点{redo怎么翻好?}组成的SSTable列表,这些是指向可能含有该子表数据的提交日志的指针{烦死定语从句了}。 该服务器把这些SSTable的索引读进内存,并通过重复redo点之后提交的更新来重建memtable。

当一个写操作到达子表服务器时,该服务器检查确信这个操作完整无误,而且发送方有权执行所描述的变换。授权是通过从一个Chubby文件里读取具有写权限的操作者列表来进行的(几乎一定会存放在Chubby客户缓存里)。合法的变换会写到提交日志里。可以用成组提交来提高大量小变换的吞吐量[13,16]。写操作提交后,写的内容就插入到memtable里。

当一个读操作到达子表服务器时,会作类似的完整性和授权检查。合法的读操作在一个由SSTable系列和memtable合并的视图里执行。由于SSTable和memtable是字典序的数据结构,合并视图可以很有效地形成。

进来方向的{incoming}读写操作在子表分拆和合并时仍能继续。

5.4 紧缩{compaction}

在执行写操作时,memtable的大小不断增加。当memtable大小达到一定阈值时,memtable就会被冻结,然后创建一个新的memtable,冻结住的memtable则被转换成SSTable并写到GFS里。这种次要紧缩过程有两个目的:缩小了子表服务器的内存用度,以及减少了在服务器当机后恢复过程中必须从提交日志里读取的数据量。 进来方向的读写操作在紧缩进行当中仍能继续。

每一个次要紧缩会创建一个新的SSTable。如果这种行为一直继续没有停止的迹象,读操作可能需要合并来自任意多SSTable的更新。相反,我们通过定期在后台执行合并紧缩来限定这类文件的数量。合并紧缩读取一些SSTable和memtable的内容,并写成一个新的SSTable。一旦紧缩完成,作为输入的这些个SSTable和memtable就可以扔掉了。

把所有SSTable重写成唯一一个SSTable的合并紧缩叫作主要紧缩。 由非主要紧缩产生的SSTable可以含有特殊的删除条目,它们使得老一点但仍活跃的SSTable中已删除的数据不再出现。而主要紧缩则产生不包含删除信息或删除数据的SSTable。Bigtable在它所有的子表中循环,并且定期对它们执行主要紧缩。这些主要紧缩使得Bigtable可以回收已删除数据占有的资源,并且还能保证已删除数据及时从系统里小时,这对存放敏感数据的服务很重要。

 

6.优化
前面一章描述了BT的实现,我们还需要很多优化工作来获得用户需要的高性能,高可用性和高可靠性.本章描述实现的一些部分,以强调这些优化.

局部性群组

客户可以将多个列族组合成局部性群族.对每个子表中的每个局部性群组都会生成一个单独的SSTable.将通常不会一起访问的列族分割成不同的局部性群组,将会提高读取效率.例如,Webtable中的网页元数据(语言和校验和之类的)可以在一个局部性群组,网页内容可以在另外一个群组:如果一个应用要读取元数据,它就没有必要去访问页面内容.

此外,每个群组可以设定不同的调试参数.例如,一个局部性群组可以被设定在内存中.内存中的局部性群组的SSTable在被子表服务器装载进内存的时候,使用的装载策略是懒惰型的.一旦属于该局部性群组的列族被装载进内存,再访问它们就不必通过硬盘了{读不懂?知道机器翻译有多难了吧?人翻译都不行}.这个特性对于需要频繁访问的小块数据特别有用:在BT内部,我们用这个特性来访问元数据表中的地址列族.

压缩

客户可以控制是否压缩一个局部性群组的SSTable.每个SSTable块(块的大小由局部性群组的调试参数确定),都会使用用户指定的压缩格式.尽管这样分块压缩{比全表压缩}浪费了少量空间,但是在读取SSTable的一小部分数据的时候,就不必解压整个文件了{那是,你们文件巨大,硬盘又便宜}.很多客户使用两遍的订制压缩方式.第一遍是Bentley and McIlroy’s方式[6],该方式在一个大的扫描窗口中将常见的长串进行压缩.第二遍是一种快速压缩算法,在一个16KB的小扫描窗口中寻找重复数据.两个算法都很快,现有机器上压缩速率为100到200MB/s,解压速率是400到1000MB/s.

尽管我们选择压缩算法的重点是速率,而非空间效率,这种两遍的压缩方式空间效率也令人惊叹{老大,别吹了,您老是在压字符串哪!你去压压运行代码看看?}.例如,在Webtable,我们用这种压缩方式来存储网页内容.针对实验的目的,我们对每个文档只存储一个版本,而非存储所有能访问的版本.该模式获得了10比1的压缩率.这比一般的Gzip的3比1或者4比1的HTML页面压缩率好很多,因为Webtable的行是这样安排的:从一个主机获取的页面都存在临近的地方,这种特性让Bentley-McIlroy算法可以从一个主机那里来的页面里找到大量的重复内容.不仅是Webtable,其他很多应用也通过选择行名来将类似内容聚集在一起,因此压缩效果非常的好{针对数据和程序特性选择的压缩算法}.当在BT中存储同一数据的多个版本的时候,压缩效率更高.

使用缓存来提高读取性能

为了提高读操作性能,子表服务机构使用两层缓存.扫描缓存是高层,它缓存子表服务器代码从SSTable获取的关键字-值对.块缓存是底层,缓存的是从GFS读取的SSTable块.对于经常要重复读取同一部分数据的应用程序来说,扫描缓存很有用.对于经常要读取前面刚读过的数据附近的其他数据(例如,顺序读{性能提升老花招:预取},或者在一个热门的行中的同一局部性群组中,随机读取不同的列)的应用程序来说,块缓存很有用{后面这句比较拗口,是说一个局部性群组里的列都在缓存里,可以随机读取}.

Bloom过滤器{需要读参考文献才知道是什么意思.从标题看,bloom是一种杂凑函数,有相对低的不命中率,所以可以用它来猜测一个关键字对应的存储数据在哪里,从而减少访问硬盘的次数,以提高性能}

如5.3节所述,一个读操作要知道一个子表的所有状态,必须从所有SSTable中读取数据.如果这些SSTable不在内存,那么就需要多次访问硬盘.我们通过允许客户对特定局部性群组的SSTable指定bloom过滤器[7],来降低访问硬盘的次数.使用bloom过滤器,我们就可以猜测一个SSTable是否可能包含特定行和列的数据.对于某些特定应用程序,使用少量内存来存储bloom过滤器换来的,是显著减少的访问磁盘次数.我们使用bloom过滤器也使当应用程序要求访问不存在的行或列时,我们不会访问硬盘.

修改日志{commit-log}的实现

如果我们把对每个子表的修改日志都另存一个文件的话,就会产生非常多的文件,这些文件会并行的写入GFS.根据每个GFS底层实现的细节,这些写操作在最终写入实际日志文件的时候,可能造成大量的硬盘寻道动作.此外,由于群组不大,为每个子表建立一个新的日志文件也降低了群组修改的优化程度.为了避免这些问题,我们将对每个子表服务器的修改动作添加到一个修改日志中,将多个子表的修改混合到一个实际日志文件中[18,20].

使用单个日志显著提高了正常使用中的性能,但是将恢复的工作复杂化了.当一个子表服务器死掉时,它以前服务的子表们将会被移动到很多其他的子表服务器上:它们每个都装载很少的几个子表.要恢复子表的状态,新的子表服务器要按照原来的服务器写的修改日志来重新进行修改.但是,这些修改记录是混合在一个实际日志文件中的.一种方法是把日志文件都读出来,然后只重复需要进行的修改项.但是,用这种方法,假如有100台机器都装载了要恢复的子表,那么这个日志文件要读取100次(每个服务器一次).

避免这个问题的方法是先把日志按照关键字排序.在排序以后,所有的修改项都是连续的了,只要一次寻道操作,然后顺序读取.为了并行的排序,我们将日志分割成64MB的段,并在不同的子表服务器上并行的排序.这个排序工作是由主服务器来协同的,当一个子表服务器表示需要从某些日志文件中开始恢复修改,这个过程就开始了.

有时,向GFS中写修改日志文件会导致性能不稳定,原因很多(例如,正在写的时候,一个GFS服务器不行了,或者访问某三个GFS服务器的网络路由断了或者拥塞).为了在GFS延迟的高峰时还能保证修改顺利进行,每个子表服务器实际上有两个线程:各自写不同的日志文件;两个线程里只有一个活跃.如果一个线程的写操作性能不好,就切换到另外一个线程,修改的记录就写入新的活跃线程的日志文件.每个日志项都有序列号,在恢复的时候,由于线程切换而导致的重复的序列号将被忽略.

加速子表的恢复

如果主服务器将一个子表从一个子表服务器移动到另外一个服务器,第一个子表服务器对子表进行轻度压缩.该压缩减少了子表服务器的日志文件中没有被紧缩的状态,从而减少了恢复时间.压缩完成以后,该服务器就停止服务该子表.然后,在卸载该子表前,该服务器再次进行一次(通常很快)轻度压缩,以消除在前面一次压缩时遗留下来的未紧缩的状态.第二次压缩做完以后,子表就可以被装载到另外一个服务器上,而不必请求从日志中恢复了.

利用不变性{immutability,不可写,可以并行读取}

除了SSTable缓存以外,由于所有生成的SSTable都是不变的,所以BT的很多其他部分都变的简单了.例如,当从SSTable读的时候,就不必进行同步.这样一来,对行的并行操作就可以非常有效的实现了.内存表是唯一一个被读和写操作同时访问的可变数据结构.为了减少在读操作中对内存表的竞争,内存表是写复制的,这样一来就可以并行进行读写操作.

因为SSTable是不变的,因此永久消除被删除的数据的问题,就转换成对过时的SSTable进行垃圾收集的问题了.每个子表的SSTable们都在元数据表进行注册.主服务器对SSTable集合进行标记-扫除的垃圾收集工作[25],元数据表保存了根SSTable集合。

最后,SSTable的不变性使分裂子表的操作更加快速。我们不必为每个分裂出来的子表建立新的SSTable集合,而是让分裂的子表集合共享原来子表的SSTable集合。


Aug 20 2008

番茄花园版Windows XP作者被拘留

Category: 乱up当秘笈ssmax @ 12:00:22

新浪科技讯 8月20日消息,番茄花园美化修改版Windows XP的作者、软件下载网站番茄花园(tomatolei.com)站长洪磊的父亲19日晚22:50独家向新浪科技证实,洪磊已经于15日(上周五)被警方拘留审查,网站被关闭,服务器及洪磊的笔记本被警方带走,为洪磊提供的技术开发支持的成都红果科技有限公司也被查封。

  洪磊被抓

  “洪磊他出事了,都好几天了,我们到现在都还没有再见到过他。”19日晚22:50分,洪磊的父亲在电话中告诉新浪科技,语气中带着焦急,“15号下午一点半就被警察带走了,到现在我们都没见上一面,我不知道到底犯了什么事。”

  洪爸爸说,“洪磊用的笔记本电脑也一起被警察带走了,说是要查他的资料,是我们苏州当地公安局派来的警察,好像说是网络监管处的。”

  洪爸爸的这番话证实了一条已经在互联网论坛中流传了数日的消息。此前,有网友在论坛中报料称,“番茄花园站长已经被苏州市虎丘区派出所,以利用互联网侵犯知识产权牟利罪刑事拘留,主犯从犯都已经落网。”

  这条传言还称,“番茄花园的老大被抓后,警方查处其帐户有200多万元存款。”这一消息未获证实。通过搜索发现,“番茄花园 被抓”这一关键词,已有近3000个网页,几天之内,这一消息已经传遍整个互联网圈。

  洪磊其人

  洪磊,网名累累,他与另外一位网名为“大番茄”的技术爱好者一起制作了番茄花园美化修改版Windows XP操作系统,他们还同时运营维护着一个名为“番茄花园”的软件下载网站。

  新浪科技辗转联系到洪磊的一位好友郑朝辉。郑朝辉所在的第一万维网主要提供ISP/ ICP (互联网信息中心)服务,洪磊刚起步时,郑朝辉为洪磊提供域名和服务器托管,“那时他做Windows XP的美化包,就是开发一个独立软件包,用户需要下载安装,后来他直接提供番茄花园版的Windows XP下载,我觉得可能存在侵权风险,就没再给他提供服务器托管了,他将服务器转移到了成都,但域名一直是我们提供服务。”

  16日,郑朝辉发现番茄花园无法访问,他拨打洪磊的手机、家里电话,均无法接听,平时经常上网聊天的洪磊,其QQ头像再也没有亮过,发出去的留言也石沉大海。传言随即袭来——洪磊已经被抓。郑朝辉考虑到番茄花园如果长期无法访问,它在搜索引擎中的排名会下降,于是在18日下午13点将其域名转向了一个简单的页面,上面写着“番茄花园娱乐网正在改版中……”。这一度让很多番茄花园的粉丝们看到了希望。

  18日当天下午,线路商找到郑朝辉,告诉他番茄花园出问题了,“和版权有关”,警方要它的注册资料。郑朝辉操作恢复了域名的原来解析状态,网站重回无法访问状态。

  “这么多年,我是见证了洪磊的成长,他比较沉稳,话语不多,除了专业方面其它的话很少,他非常的努力,生活也很节俭。” 郑朝辉回忆说。

  番茄花园装机量或超千万

  资料显示,番茄花园的名字由“大番茄”所起,源于一部《汉城奇缘》的韩剧:剧中一位男主角喜欢一个女孩,送女孩回家后,送给了她一个番茄的盆景。男孩说,你知道我为什么喜欢番茄吗?因为番茄表里如一,你所看到的番茄永远一样。也就是代表做人要表里如一,不要表面一套,背地里一套。

  洪磊和大番茄一起制作的操作系统不仅对Windows XP进行主题、桌面、按钮等外观美化,也取消了微软的正版验证程序,同时对微软原版操作系统中一些不常用功能进行了关闭或卸载,而且打开了原版系统中的一些功能模块限制,加快了平台运行速度,并在安装完成系统平台后集成一些实用的小工具。

  经过几年的发展和版本升级,在电脑爱好者的软件包里、在电脑城的装机商桌子上、在盗版光盘的小贩手上,都可以看到番茄花园版Windows XP的身影,它也成了继微软原版操作系统之外普及度最高的XP版本。其他的修改版本比起番茄花园的装机量都要少的多。有业内人士估测,番茄花园版Windows XP的装机量可能超过千万。

  番茄花园对XP的这些修改都并没有得到微软的授权,其软件属于不折不扣的盗版软件。番茄花园对版权的说法是,“本站仅仅提供一个观摩学习的环境,将不对任何资源负法律责任”及“本站所有资源请在下载后24小时内删除。如果您觉得满意,请购买正版”。

  番茄花园网站成立于2003年,在国内软件下载网站颇有知名度,他不仅为用户提供最新版的番茄花园版Windows XP的下载,还提供其他软件的下载,此外还提供论坛、博客、图铃等服务。

  捆绑流氓软件获利

  就像番茄花园在版本声明里面提及的,它只提供免费下载,并不出售盗版光盘,市面上见到的盗版光盘均是网友下载后自行刻录或盗版商批量生产的软件,并非洪磊他们出售的,从这个角度上看,番茄花园并未由此获利。

  根据我国的法律,未经许可修改他人软件,如果没有因此获利,定罪较为困难,尽管洪磊没有通过出售光盘获利,但据了解,番茄花园中捆绑了广告插件,这可能是他获利的途径。

  一些使用过番茄花园版XP的用户反映,他们在操作系统中发现了阿里巴巴的竞价、3721、一搜、多多QQ表情、CNNIC、播霸网络电视等流氓软件。洪磊所在的番茄花园团队后来澄清说,这些软件是第三方公司下载了番茄花园版XP后自己装上的,然后再提供给用户下载,或通过光盘传播。但一些从番茄花园网站下载美化版XP发现里面仍然有两款软件,一款为易趣网的插件,一款为雅虎助手。番茄花园论坛的一位管理员曾表示,这两款软件不是流氓软件,有安装提示,且可以卸载,不具备流氓软件的特征。

  既便如此,番茄花园在后来的版本中捆绑了插件已是不争的事实。按照当时盛行的行业规则,批量的预装插件可以按照装机量获得广告收入。

  近日的论坛报料指出,警察在“番茄花园的老大被抓后,查处其帐户有200多万元存款”,如果这一消息属实,这也许就是番茄花园的非法获利。

  微软收网?

  番茄花园作者被拘的消息已经让整个修改版XP圈子风声鹤唳。

  据新浪科技调查了解,类似番茄花园的修改版XP还包括深度版、雨林木风版、电脑公司装机版、铂金花园版、萝卜家园版、极速工作室版、诺德尔版、永航技术版等,这其中的一些版本的网站在这几天开始无法访问,其论坛中的介绍如何破解微软正版验证的帖子也被删除,至于是同样在接受调查还是仅“关门避避风头”还不清楚。

  有分析认为,番茄花园此次被调查与奥运期间严打盗版侵权不无关系。商务部及国家工商总局7月22日曾联合发出通知,要求各地在奥运期间,严厉打击“地摊、游商小贩销售假冒侵权商品行为”,以做好知识产权保护工作。

  由于番茄花园涉及的是版权问题,其可能存在的侵权行为正是涉及微软公司,因此有人猜测,此次洪磊被拘留微软“功不可没”。微软中国公司尚未对此发表评论。

  有网友认为,“番茄花园因为自身的一些特点在一些人群中受到欢迎,它为微软Windows XP操作系统在中国的普及起到了很大的促进作用,微软赶在XP即将退市时‘动手’,其动机值得怀疑,这是卸磨杀驴的行为。”

  也有一些网友表达了不同的看法,“中国加强知识产权保护的政策是不变的,如果有侵权行为,受到查处是理所当然的,即使微软在背后推动此事,那也是他的正当权益。”

  国家知识产权总局副局长张勤在今年4月接受新浪科技独家专访时曾表示,相关部门现在已经意识到在知识产权保护领域,一些国际企业“放水养鱼,鱼大了后拉网收鱼”带来的危害,今后将加强对类似的行为进行规范。


Aug 19 2008

四年了

Category: 乱up当秘笈ssmax @ 18:14:56

不知不觉就四年了,是时候把这些股票都卖光了,可怜我们4年的加起来都没有人家卖一次的多,唉。


Aug 18 2008

痛苦与坚持

Category: 乱up当秘笈ssmax @ 15:10:27

刘翔最后还是因为伤痛退出了110米栏预赛。。。一晃眼就四年了,我记得上次雅典决赛的那天,我在家加班,刚好是misc割接,要搞到两三点的,开着台小电视在看,原本没有注意的,直到出场才直到有中国人。。。最后还跑了12秒90拿了冠军,过了几秒修正为12秒88,平了世界记录,那个时候真tmd兴奋。。。刘翔可以说是从默默无名到家喻户晓了,不过希望越大就失望越大,这次在家门口,用这种方式退出比赛,心寒。。。


« Previous PageNext Page »