发布于：2018-09-06 21:39:00 大约 4 分钟
Django

Django 中的一些非入门级用法

为什么这里说是"非入门级"用法呢，因为我个人觉得这是我接触Django之后一段时间才开始了解的用法，但是说是高级用法又太夸张了，所以用了这么一个诡异的”非入门级“的定位。

下面的示例中使用下面的model，简单描述一下并非真实代码

from django.db import models

class Staff(models.Model):
    name = models.CharField(max_length=10)
    age = models.IntegerField()


class Order(models.Model):
    staff = models.ForeignKey(  # 订单负责人
        'Staff',
        null=True,
        on_delete=models.SET_NULL,
    )
    price = models.IntegerField()   # 订单的价值

0X00 使用Avg()/Sum()/Count()/Max()/Min()

这些方法的用法很简单，顾名思义。不过需要配合下面介绍的annotate()或aggregate()使用。

from django.db.models import Avg, Sum, Count, Max, Min

name	function
Avg	求平均数
Sum	求和
Count	计数
Max	求最大
Min	求最小

0X01 使用annotate()

最基础的查询就是从一张表中查询符合某条件的字段，而使用annotate()可以得到一些我们手动计算得到的值，并将其作为Queryset中Item的一个属性来调用。

如果我想要查询每个人(Staff)手下有多少个订单(Order)，那么该怎么查呢，使用初级的用法可以写出类似下面的代码。但是有一个比较严肃的问题：会产生用户数量 + 1次的查询。这里只有少数用户问题不大，如果有上千甚至上万个用户，那么就会产生几千几万次查询，那对数据库的压力是很恐怖的。

staff_list = Staff.objects.filter()
for staff in staff_list:
    order_count = Order.objects.filter(staff=staff).count()

使用annotate()方法就可以有效解决这个问题

staff_queryset = Staff.objects.filter().annotate(staff_order_count=Count('order'))
for staff in staff_queryset:
    print(staff.staff_order_count)

这里的staff_order_count字段是表中并不存在的，是通过annotate()方法临时存储的一个字段。同样的，再一个annotate()方法中可以加入多个参数，使用同样的方法去统计和获取数据即可。

在annotate()中使用Count()一定要是有外键关联才行。例如本例中，Order表中有一个外键字段staff与表Staff关联起来了，那么就可以在Django中通过Staff.order_set来获取关联到Staff的Order，所以也就可以使用Count()方法来进行统计了。

生成查询的SQL语句也打出来方便理解。

SELECT "Post_staff"."id", "Post_staff"."name", "Post_staff"."age", COUNT("Post_order"."id") AS "x" FROM "Post_staff" LEFT OUTER JOIN "Post_order" ON ("Post_staff"."id" = "Post_order"."staff_id") GROUP BY "Post_staff"."id", "Post_staff"."name", "Post_staff"."age"

0X02 使用aggregate()

使用aggregate()可以使得查询的返回值由一个Queryset变成一个dict，每个key和对应的value由自己计算得到。

如果我需要计算出所有人中年龄最大、最小、平均值该怎么办？初级用法可能需要先用一个查询得出所有人的年龄，然后再单独去计算最大最小平均值。写出类似如下代码，虽然目前问题不大，不过当逻辑复杂起来之后就会难以理解并且代码量较大。

queryset = Staff.objects.filter()
age_list = [staff.age for staff in queryset]

age_sum = sum(age_list)
age_max = max(age_list)
age_min = min(age_list)
age_avg = (sum(age_list) * 1.0) / len(age_list)

但是如果使用aggregate()方法写出不仅逻辑清晰不易出错，而且代码量少了很多，更简单易读。

Staff.objects.filter().aggregate(
    age_sum=Sum('age'),
    age_max=Max('age'),
    age_min=Min('age'),
    age_avg=Avg('age'),
)

这段代码就会直接输出如下dict，需要的数据直接取即可。

{
    "age_sum": 71,
    "age_max": 30,
    "age_min": 19,
    "age_avg": 23.666666666666668
}

0X03 使用Case/When

Django中的Case()/When()是非常实用一对方法，恰当使用可以大幅度减小统计功能的代码量、逻辑复杂度等。

假设有如下需求”年龄小于18的为未成年(1)，年龄在19到30之间的为青年(2)，年龄在31 到60的为中年(3)，其他为老年(0)“，那么使用Case/When方法再配合annotate()方法就可以优雅得实现功能。

Staff.objects.filter().annotate(
    age_tag = Case(
        When(
            age__lt=18,
            then=1，
        )，
        When(
            age__lt=30,
            then=2,
        )
        When(
            age__lt=60,
            then=3,
        )
        default=0,
        output_field=IntegerField(),
    )
)

# 上面的代码类似于这种
age_tag = 1 if age < 18 else 2 if age < 30 else 3 if age < 60 else 0

# emm...这种更形象一点
if age < 18:
    age_tag = 1
elif age < 30:
    age_tag = 2
elif age < 60:
    age_tag = 3
else:
    age_tag = 0

上面是计算一个QueyrSet中每一个item的情况，还有一种情况是统计一个model中所有数据，例如这个需求：”统计所有Order中，单价最高、最低和平均值“。使用Case()/When()也可以完成任务，并且比初级用法更好一些。

Order.objects.filter().aggregate(
    max_price=Max('price'),
    min_price=Min('price'),
    avg_price=Avg('price'),
)

内容整理的有点差，各位发现了什么疏漏和错误请及时联系我，防止误导别人。如果文章对大家带来了帮助，那我还是很开心的嘿嘿

感谢您的支持

如果您喜欢这篇文章，可以通过以下方式支持我：

0X00 使用Avg()/Sum()/Count()/Max()/Min()

0X01 使用annotate()

0X02 使用aggregate()

0X03 使用Case/When

感谢您的支持

相关博文推荐

Django 中的 objects

记一次 Django save 导致的数据异常

如何在 Django 与 DRF 中优雅地校验权限

为什么 Django 需要uWSGI

Django 相对优雅地导出 CSV