Python的词法分析与语法分析

首页 > 脚本专栏 > python 更新日期: 2015-06-09
这篇文章主要介绍了Python的词法分析Lexical Analysis与 语法分析Syntactic Analysis,需要的朋友可以参考下
词法分析(Lexical Analysis):分析由字符组成的单词是否合法,如果没有问题的话,则产生一个单词流。
语法分析(Syntactic Analysis):分析由单词组成的句子是否合法,如果没有问题的话,则产生一个语法树。
在词法分析器分析源代码文本的时候,有一个概念需要明确:
1.物理行:由回车字符序列(在Windows上是CR LF,在Unix上是LF)结尾的字符序列组成一个物理行。
2.逻辑行:由一个或者多个物理行组成,可以明确地使用反斜杠(\)来连接多个物理行使之成为一个逻辑行;或者,处在圆括号,中括号,花括号内的表达式可以跨越多个物理行,但是被当作一个逻辑行。
词法分析器是面向逻辑行的,也就是说,对于词法分析器而言,只有逻辑行才算是一行,它只在逻辑行结束之处才产生NEWLINE这个单词或者说token。
对于每一处缩进,不管它有多少个空白字符,词法分析器只会产生一个INDENT单词或者说token,代表缩进一级,每当要退出一级缩进的时候,词法分析器就会产生一个DEDENT单词或者说token。注意,单词DEDENT并没有一个或一组字符与之对应,它是完全的逻辑概念。
Python使用稍作修改的BNF(巴科斯范式)来表示词法与语法规则。
下面重点说一下需要注意的地方,以避免发生一些低级但是隐蔽的编程错误。
1.标识符是区分大小写的,但是仍然不要仅仅用大小写不同来区分两个变量。
2.不要使用那些在其它编程语言中是关键字的标识符作为变量名,因为它们很可能会成为Python的关键字。
3.不要使用Python明确声明有特殊意义的标志符作为变量名(这类变量一般以下划线开头),除非明确自己要使用那个特殊含义。
4.不要在Python中使用$和?(字符串中除外),它们不是合法的字符。
5.不要混用Tab和空格来表示缩进,只使用其中一种,并养成习惯。
6.整数字面常量有10,16,8,2几种表示方法,如果使用16进制,请写0xa或者0Xa;如果使用8进制,请写0o7或者0O7;如果使用2进制,请写0b1或者0B1;总之,不要省略掉那个标识进制的字母,建议只使用小写字母。
7.在整数字面常量后加一个l或者L就形成了一个长整数,建议只使用L,因为小写l看起来像数字1.
8.整数使用32位表示,但是长整数并不限于多少位表示,在内存允许的情况下,它可以表示任意大小的整数,这与C语言等是不一样的。
9.如果一个整数字面常量的值超过32位整数的表示范围,那么Python会自动将它升级为长整数,但是在早期的Python实现中可能并非如此,因此如果你预计需要一个很大的整数值,请明确使用长整数。
10.浮点数字面常量只有10进制形式。

> 本站内容系网友提交或本网编辑转载,其目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请及时与本网联系,我们将在第一时间删除内容!

相关文章
  • C/C++程序编译流程详解
    C/C++程序编译流程详解
    C/C++程序编译过程包括下面4个阶段:1.预处理,2.编译,3.汇编,4.链接.下面我们就来详细分析下这几个阶段.程序的基本流程如图: 1.预处理 预处理相当于根据预处理指令组装新的C/C++程序.经过预处理,会产生一个没有宏定义,没有条件编译指令,没有特殊符号的输出文件,这个文件的含义同原本的文件无异,只是内容上有所不同. 读取C/C++源程序,对其中的 ...
  • Python数据类型详解三元祖:tuple
    本文给大家介绍的是Python数据类型中的元祖tuple,简单的说Tuple,与列表一样,元素也是不可变的,但与列表不同,在一个元祖可以包含不同类型的元素一.基本数据类型 整数:int字符串:str(注:\t等于一个tab键)布尔值: bool列表:list 列表用[] 元祖:tuple元祖用()字典:dict注:所有的数据类型都存在想对应的类列里,元祖和列 ...
  • Python对list列表结构中的值进行去重的方法总结
    这篇文章主要介绍了Python对列表list中的值进行去重的方法总结,文中给出的方法都能保持去重后的顺序不发生改变,需要的朋友可以参考下今天遇到一个问题,在同事随意的提示下,用了 itertools.groupby 这个函数.不过这个东西最终还是没用上.问题就是对一个list中的新闻id进行去重,去重之后要保证顺序不变.直观方法最简单的思路就是: ids = ...
  • Python环境下安装使用异步任务队列包Celery的基础教程
    这篇文章主要介绍了Python环境下安装使用异步任务队列包Celery的基础教程,Celery的分布式任务管理适合用于服务器集群的管理和维护,需要的朋友可以参考下1.简介 celery(芹菜)是一个异步任务队列/基于分布式消息传递的作业队列.它侧重于实时操作,但对调度支持也很好.celery用于生产系统每天处理数以百万计的任务.celery是用Python编 ...
  • Python开发之快速搭建自动回复微信公众号功能
    Python开发之快速搭建自动回复微信公众号功能
    这篇文章主要介绍了Python开发之快速搭建自动回复微信公众号功能的相关资料,需要的朋友可以参考下在之前的一篇文章 Python利用 AIML 和 Tornado 搭建聊天机器人微信订阅号 中用 aiml 实现了一个简单的英文聊天机器人订阅号.但是只能处理英文消息,现在用 图灵机器人 来实现一个中文的聊天机器人订阅号. 这里主要介绍如何利用 Python 的 ...
猜你喜欢