一、界面和用户体验(Interface and User Experience)
1.1知道各大浏览器执行Web标准的情况,保证你的站点在主要浏览器上都能正常运行。你至少要测试以下引擎:Gecko(用于Firefox)、Webkit(用于Safari、Chrome和一些手机浏览器)、IE(你可以利用微软发布的Application Compatibility VPC Images进行测试)和Opera。同时,不同的操作系统,可能也会影响浏览器如何呈现你的网站。
1.2除了浏览器,网站还有其他使用方式:手机、屏幕朗读器、搜索引擎等等。你应该知道在这些情况下,你的网站的运行状况。MobiForge提供了手机网站开发的一些相关知识。
1.3知道如何在基本不影响用户使用的情况下升级网站。通常来说,你必须有版本控制系统(CVS、Subversion、Git等等)和数据备份机制(backup)。
1.4不要让用户看到那些不友好的出错提示。
1.5不要直接显示用户的Email地址,至少不要用纯文本显示。
1.6为你的网站设置一些合理的使用限制,一旦超过门槛值,就自动停止服务。(这也与网站安全相关。)
1.7知道如何实现网页的渐进式增强(progressive enhancement)。
1.8用户发出POST请求后,总是将其重导向(redirect)至另外一个网页。
1.9不要忘记网站的可访问性(accessibility,即残疾人如何使用网站)。对于美国网站来说,有时这是法定要求。WAI-ARIA有一些这方面很好的参考资料。
二、安全性(Security)
2.1阅读《OWASP开发指南》,它提供了全面的网站安全指导。
2.2了解SQL注入(SQL injection)及其预防方法。
2.3永远不要信任用户提交的数据(cookie也是用户端提交的!)。
2.4不要明文(plain-text)储存用户的密码,要hash处理后再储存。
2.5不要对你的用户认证系统太自信,它可能很容易就被攻破,而你事先根本没意识到存在相关漏洞。
2.6了解如何处理信用卡。
2.7在登录页面及其他处理敏感信息的页面,使用SSL/HTTPS。
2.8知道如何对付session劫持(session hijacking)。
2.9避免"跨站点执行"(cross site scripting,XSS)。
2.10避免"跨域伪造请求"(cross site request forgeries,XSRF)。
2.11及时打上补丁,让你的系统始终跟上最新版本。
2.12确认你的数据库连接信息的安全性。
2.13跟踪攻击技术的最新发展,以及你使用的平台的最新安全漏洞。
2.14阅读Google的《浏览器安全手册》(Browser Security Handbook)。
2.15阅读《网络软件的黑客手册》(The Web Application Hackers Handbook)。
三、性能(Performance)
3.1只要有可能,就使用缓存(caching)。正确理解和使用HTTP caching与HTML5离线储存。
3.2优化图片。不要把一个20KB的图片文件,作为重复出现的网页背景图案。
3.3学习如何用gzip/deflate压缩内容(deflate方式更可取)。
3.4将多个样式表文件或脚本文件,合为一个文件,这样可以减少浏览器的http请求数,以及减小gzip压缩后的文件总体积。
3.5浏览Yahoo的Exceptional Performance网站,里面有大量提升前端性能的优秀建议,还有他们的YSlow工具。Google的page speed则是另一个用来分析网页性能的工具。两者都要求安装Firebug。
3.6如果你的网页用到大量的小体积图片(比如工具栏),就应该使用CSS Image Sprite,目的是减少http请求数。
3.7大流量的网站应该考虑将网页对象分散在多个域名(split components across domains)。
3.8静态内容(比如图片、CSS、JavaScript、以及其他cookie无关的网页内容)都应该放在一个不需要使用cookie的独立域名之上。因为域名之下如果有cookie,那么客户端向该域名发出的每次http请求,都会附上cookie内容。这里的一个好方法就是使用"内容分发网络"(Content Delivery Network,CDN)。
3.9将浏览器完成网页渲染所需要的http请求数最小化。
3.10使用Google的Closure Compiler压缩JavaScript文件,YUI Compressor亦可。
3.11确保网站根目录下有favicon.ico文件,因为即使网页中根本不包括这个文件,浏览器也会自动发出对它的请求。所以如果这个文件不存在,就会产生大量的404错误,消耗光你的服务器的带宽。
四、搜索引擎优化(Search Engine Optimization,SEO)
4.1使用"搜索引擎友好"的URL形式,比如example.com/pages/45-article-title,而不是example.com/index.php?page=45。
4.2不要使用"点击这里"之类的超级链接,因为这样等于浪费了一个SEO机会,而且降低了"屏幕朗读器"(screen reader)的使用效果。
4.3创建一个XML sitemap文件,它的缺省位置一般是/sitemap.xml(即放在网站根目录下)。
4.4当你有多个URL指向同一个内容时,在网页代码中使用<link rel="canonical" ... />。
4.5使用Google的Webmaster Tools和Yahoo的Site Explorer。
4.6从一开始就使用Google Analytics(或者开源的访问量分析工具Piwik)。
4.7知道robots.txt的作用,以及搜索引擎蜘蛛的工作原理。
4.8将www.example.com的访问请求导向example.com(使用301 Moved Permanently重定向),或者采用相反的做法,目的是防止Google把它们当做两个网站,分开计算排名。
4.9知道存在着恶意或行为不正当的网络蜘蛛。
4.10如果你的网站有非文本的内容(比如视频、音频等等),你应该参考Google的sitemap扩展协议。
五、技术(Technology)
5.1理解HTTP协议,以及诸如GET、POST、sessions、cookies之类的概念,包括"无状态"(stateless)是什么意思。
5.2确保你的XHTML/HTML和CSS符合W3C标准,使得它们能够通过检验。这可以使你的网页避免触发浏览器的古怪行为(quirk),而且使它在"屏幕朗读器"和手机上也能正常工作。
5.3理解浏览器如何处理JavaScript脚本。
5.4理解网页上的JavaScript文件、样式表文件和其他资源是如何装载及运行的,考虑它们对页面性能有何影响。在某些情况下,可能应该将脚本文件放置在网页的尾部。
5.5理解JavaScript沙箱(Javascript sandbox)的工作原理,尤其是如果你打算使用iframe。
5.6知道JavaScript可能无法使用或被禁用,以及Ajax并不是一定会运行。记住,"不允许脚本运行"(NoScript)正在某些用户中变得流行,手机浏览器对脚本的支持千差万别,而Google索引网页时不运行大部分的脚本文件。
5.7了解301重定向和302重定向之间的区别(这也是一个SEO相关问题)。
5.8尽可能多得了解你的部署平台(deployment platform)。
5.9考虑使用样式表重置(Reset Style Sheet)。
5.10考虑使用JavaScript框架(比如jQuery、MooTools、Prototype),它们可以使你不用考虑浏览器之间的差异。
六、解决bug
6.1理解程序员20%的时间用于编码,80%的时间用于维护,根据这一点相应安排时间。
6.2建立一个有效的错误报告机制。
6.3建立某些途径或系统,让用户可以与你接触,向你提出建议和批评。
6.4为将来的维护和客服人员撰写文档,解释清楚系统是怎么运行的。
6.5经常备份!(并且确保这些备份是有效的。)除了备份机制,你还必须有一个恢复机制。
6.6使用某种版本控制系统储存你的文件,比如Subversion或Git。
6.7不要忘记做单元测试(Unit Testing),Selenium之类的框架会对你有用。
除非特别特殊的系统,大部分的开发都是建立在开源项目的基础上。甚至有很多整站系统可以直接用。
因此,在项目开始前需要研究离你所需要系统最近的开源项目,有哪些开源系统可以引用到你的项目中。
在这个基础上,了解这些开源项目采用了哪些技术。确定平台和开发任务。
已经很少有项目是从头开始写代码的。
在打算开发一个网站时,选择什么语言,是首先需要面对的问题。目前主流的WEB开发语言有ASP.NET、PHP、JSP; 作为MS上世纪老将ASP,就不再提及,如果是因为维护方面的原因而必须使用,可考虑升级到ASP.NET,而作为新开发一个语言,实在找不到理由再使用它了;
以下将对这三种语言做对比,以供权衡:
上手度
.NET: 5分
PHP:3分
JSP:1分
如果你是一个WEB方面的新手,这三门WEB语言的学习成本差别很大。ASP.net 作为微软的产品,继承了其一贯的特点,方便上手,易用;甚至你都不用编码,靠着鼠标拖拖拽拽,都能整一个网站出来(网上,就有这样的视频讲解。当然,这样出来的网站是没法应用到实际中的,且不说其代码复用率极其低下,拖拽出来的代码,灵活度太小,效率也低(eg:gridview中的分页实现载入数据是一次全部载入的))。同时,凭着其强大的开发工具visual studio系列,在程序出现bug时,能最大程度的提供问题说明,让开发者尽快定位到问题所在。JSP相比而言难度就大多了,光是配置一个开发环境就得耗费不少精力,JSP语言最为头疼的就是程序调试方面,当程序出现问题时,并不能得到友好的错误提示,调试BUG比较耗时。再就是JSP依托的JAVA过于庞大,着实是个无底洞,开始容易,越往后发现要学的越多,一般互联网公司,还真难以有几个能驾驭,再普及的;PHP学习算是基于.net和JSP之间,语法与C语言一脉相承,上手也算容易;
资源
.NET:4分
PHP:5分
JSP:2分
资源包括能获取到的学习资料、开放源码,以及各种插件和库。PHP在这方面遥遥领先,粗略看来,各种网站的知名开源产品,大都使用PHP实现,如博客wordpress、论坛discuz、Wiki知识库MediaWiki等;
相应的各种插件、库、开源代码的数量和质量更是其它语言无法相比。.NET资源也比较丰富,选用.NET幸福的是有MS这么一个强大后台做有力的技术支持,CSDN 的资料不但多,质量更是上乘;JSP由于其门槛高的缘故,致使在这方面的资料也比较少;
系统架构实施
.NET:3分
PHP:5分
JSP: 3分
.NET部署环境是windows 03/08+MS SQL Server + IIS。都是微软的产品,优点就是部署容易,方便,兼容性好。最为头疼就是安全方面的问题,windows下总是得不停的打补丁,但还是时常遭受这样那样的攻击;再就是数据库方面,MS SQL 与Oracle在并发处理、效率上始终有个数据量级的差距,2008发布之后据说是好了些,但总是让人感觉不大放心;PHP就是LAMP架构,即Linux+Apache+My Sql + PHP;Linux平台在我这几年的熟悉后,深刻体会到其就是为服务器而生,各种的工具让人爱不释手;My Sql作为开源产品,首先在软件费用上就公司能省下一大笔,其性能优秀,即使某日网站规模的扩大致使数据库出现瓶颈,也可组建一个数据库团队来研究改进。不过,在Oracle收购MySql之后,为其前景蒙上了一层阴影。有可能,在不久的将来,MySql的部分功能就会闭源。JSP的架构小则是Linux+apache+tomcat+MySql ,大则Linux + Apache + Java (WebSphere) + Oracle,对于一般小型网站的部署,大都选用第一种;WebSphere过于庞大,一般部署都得独自占用一台服务器;Oracle是数据库中的王者,性能优异(国内银行证券的数据库应用,一般只有DB2和Oracle两种选择),但其价格不菲,非一般创业公司能够承担(按CPU收费,一般25w/cpu/每年;次年会收取15%的维护费)需要提一下的是JSP系统架构部署有些难度,架构出现问题后,排错是个很痛苦的过程。
管理维护
.NET:2分
PHP:5分
JSP: 4分
WEB管理中,经常会通过远程来管理网站,远程管理的方便与否关键看命令行工具的支持力度及脚本环境的操作便捷性。.NET只能跑在Windows平台上,远程管理一般只能通过图形化界面远程鼠标操作,当网速比较慢的时候,管理员的心情无比复杂,远程操作基本上是在一幅幅图片上估计下一张图片中鼠标的移动位置;Windows平台的命令行环境非常差,IIS的命令行工具功能少,bat脚本也难学难用(虽然可以通过安装cygwin工具来模拟linux shell环境,但系统操作,系统资源监控方面还是无能为力); Linux下就幸福多了,远程基本上都是通过SSH连接,安全有保证,shell脚本消耗的网络带宽也只是图形化界面的百分之一,管理流畅,心情舒畅;各种程序消耗资源都可远程监控;Linux就是为服务器而生,此话毫不为过。PHP、JSP都可跨平台,一般其系统部署都是在Linux下,MySql数据库和apche服务器都可通过相应的命令行工具有效管理。JSP的应用服务器在这方面支持要少些;
跨平台
.NET:0 分
PHP:5分
JSP:5分
曾几何时,我对跨平台不屑一顾,想着好端端的一个应用,既然是定位在这个平台上开发的,干嘛要移植到其它平台上。如今,我是深有体会。手上一个项目,公司由于成本压力,需要将应用从 SUN Unix移植到Linux平台(Redhat)。我们的程序基本上不用改动,在Linux上编译就只多了几个警告,改改就可上线了;而另一个项目,我被深度套牢!我们使用的是Windows平台的ASP.NET,由于受到Windows的病毒泛滥加上WEB管理的麻烦,迫切希望能移植到Linux平台,但这基本上不可能实现。若真想将这应用移植,只有下狠心使用PHP等重写应用,换系统架构。PHP、JSP都可跨平台,不用多说。
当前主流应用的选择
PHP:当前WEB创业公司的语言选择主要集中在PHP。除了上述原因还有一个重要原因就是PHP开发程序员队伍的规模。
淘宝网(阿里巴巴): Linux操作系统 + Web 服务器: Apache +PHP
PHP的应用太多,这里不再列举;
ASP.NET:在创业公司中应用不多,知名互联网应用有限,目前比较知名的应用有:
博客园、CSDN、eBay、MySpace等;
JSP:JSP实施比较庞大,用好的就得用到websphere或weblogic这样的大物件,种种原因使得JSP在互联网公司中应用并不多,除了阿里巴巴,没有几个公司能驾驭JAVA(JSP)。深入JAVA需要多年修炼,而成精之后,公司是否有足够的薪水来留住这么一群高手是个考验;
阿里巴巴:Linux+(JSP)
总结
如今流行的Ruby,也是创业公司的一个选择;python的优雅,也可考虑尝试(豆瓣使用的Python);但选择这些语言的一个风险是公司规模扩大后,是否能找到足够的人才得打个问号。总的来说,创业面临选择一门开发语言,PHP当是首选;如果不考虑Linux平台,铁定在Windows上运营,.NET也是一个不错的选择。JSP小公司勿近,危险,容易造成的资金套牢。