1. JSON 概念
JSON (JavaScript Object Notation) 是一种轻量级的数据交换格式:
人类可读的文本格式完全独立于编程语言用于存储和传输结构化数据广泛应用于API通信、配置文件和数据存储
2. JSON 核心原理
键值对结构:类似字典的概念树状层级:支持嵌套数据结构数据类型支持:字符串、数字、布尔值、数组、对象、null无状态:不包含函数或可执行代码文本格式:使用纯文本表示,默认UTF-8编码
3. JSON 语法规范
基本结构
{
"key1": "value",
"key2": 42,
"key3": true,
"key4": null,
"key5": ["数组", "元素"],
"key6": {
"nested": "嵌套对象"
}
}
语法规则
键名:必须用双引号包裹字符串值:必须用双引号包裹数据类型:
字符串:"text"数字:123 或 3.14布尔值:true 或 falsenull:null数组:[值1, 值2]对象:{"key": value}
分隔符:
键值对用冒号 : 分隔元素用逗号 , 分隔
不支持特性:
注释尾随逗号十六进制数字
4. JSON API 功能(Python)
核心函数
函数功能主要参数json.dump()序列化到文件obj, fp, indent, ensure_asciijson.dumps()序列化为字符串obj, indent, separators, defaultjson.load()从文件反序列化fp, object_hook, parse_floatjson.loads()从字符串反序列化s, object_hook, parse_int关键参数说明
序列化参数:
indent:缩进空格数(美化输出)ensure_ascii=False:允许非ASCII字符(如中文)default:自定义对象序列化函数separators=(',', ':'):紧凑格式
反序列化参数:
object_hook:自定义字典转换函数parse_float:自定义浮点数解析parse_int:自定义整数解析
5. JSON 处理流程
6. 应用示例
示例1:基本序列化与反序列化
输入(Python对象):
data = {
"server": "web01",
"status": "online",
"ports": [80, 443],
"active": True
}
序列化:
import json
# 转换为JSON字符串
json_str = json.dumps(data, indent=2)
print(json_str)
输出(JSON字符串):
{
"server": "web01",
"status": "online",
"ports": [
80,
443
],
"active": true
}
反序列化:
# 从JSON字符串转换回Python对象
restored_data = json.loads(json_str)
print(restored_data["ports"][0]) # 输出: 80
示例2:文件读写
写入JSON文件:
config = {
"database": {
"host": "db.example.com",
"port": 3306,
"user": "admin"
},
"timeout": 30
}
with open("config.json", "w") as f:
json.dump(config, f, indent=4)
生成的config.json:
{
"database": {
"host": "db.example.com",
"port": 3306,
"user": "admin"
},
"timeout": 30
}
读取JSON文件:
with open("config.json", "r") as f:
loaded_config = json.load(f)
print(loaded_config["database"]["host"]) # 输出: db.example.com
示例3:处理自定义对象
自定义设备类:
class NetworkDevice:
def __init__(self, name, ip):
self.name = name
self.ip = ip
序列化自定义对象:
def device_encoder(obj):
if isinstance(obj, NetworkDevice):
return {"device_name": obj.name, "ip_address": obj.ip}
raise TypeError("不可序列化的对象")
router = NetworkDevice("core-router", "10.0.0.1")
json_str = json.dumps(router, default=device_encoder)
print(json_str)
# 输出: {"device_name": "core-router", "ip_address": "10.0.0.1"}
反序列化自定义对象:
def device_decoder(dct):
if "device_name" in dct and "ip_address" in dct:
return NetworkDevice(dct["device_name"], dct["ip_address"])
return dct
device = json.loads(json_str, object_hook=device_decoder)
print(f"{device.name}: {device.ip}") # 输出: core-router: 10.0.0.1
示例4:处理特殊数据类型
输入(包含日期):
from datetime import datetime
log_entry = {
"event": "login",
"user": "alice",
"timestamp": datetime.now()
}
自定义序列化:
def custom_serializer(obj):
if isinstance(obj, datetime):
return obj.isoformat()
return str(obj) # 其他类型转为字符串
json_str = json.dumps(log_entry, default=custom_serializer)
print(json_str)
输出:
{
"event": "login",
"user": "alice",
"timestamp": "2023-11-15T14:30:45.123456"
}
7. 常见错误处理
invalid_json = "{'key': 'value'}" # 错误:JSON要求双引号
try:
data = json.loads(invalid_json)
except json.JSONDecodeError as e:
print(f"JSON解析错误: {e.msg}")
print(f"位置: 行 {e.lineno}, 列 {e.colno}")
# 实际输出: JSON解析错误: Expecting property name enclosed in double quotes
8. 最佳实践
美化与压缩:
开发环境:使用 indent=2 方便阅读生产环境:使用 separators=(',', ':') 减少体积
中文支持:
data = {"name": "服务器"}
json_str = json.dumps(data, ensure_ascii=False) # 正确显示中文
数据类型转换:
JSON数字 → Python int/floatJSON数组 → Python listJSON对象 → Python dictJSON null → Python None
安全注意:
不要解析不可信来源的JSON设置最大解析深度:json.loads(data, max_depth=10)
JSON是现代应用中最常用的数据交换格式,掌握它的基本使用和Python处理技巧,是自动化运维和开发的基础能力。从配置文件到API通信,JSON无处不在!
