「2024 杭电多校 3」1004. 游戏

Description

Link:HDU 7460

nn 名玩家进行游戏,每个玩家都有一个初始能力值 aia_i

游戏会进行 tt 轮,每一轮会等概率随机选择两个不同的人,将他们的能力值分别加 11

求游戏结束后,1i<jn[ai=aj]\sum\limits_{1 \leq i < j \leq n} [a_i = a_j] 的期望值。答案对 998244353998244353 取模。

数据范围:2n1062 \leq n \leq 10^61t1071 \leq t \leq 10^71ai1061 \leq a_i \leq 10^6

时空限制:66s / 512512MiB。

Solution

由期望的线性性,答案即为 1i<jnP([ai=aj])\sum\limits_{1 \leq i < j \leq n} P([a_i = a_j])。而 P([ai=aj])P([a_i = a_j]) 显然只和两者初值之间的差值 aiaj|a_i - a_j| 有关。

于是我们先使用一次翻转卷积,处理出所有差值为 d(0d106)d(0 \leq d \leq 10^6) 的数对个数。注意特判 d=0d = 0

考虑两个差值为 dd 的数对,a2,a1,a0a_2, a_1, a_0 分别表示一轮游戏,差值 1,0,+1-1, 0, +1 的概率。则我们要求的概率即为 [xd](a2x+a1+a01x)t[x^d]\left(a_2x + a_1 + a_0\frac{1}{x}\right)^t

为了消去负数次项,乘上 xx,此时要求的概率即为 [xd+t](a2x2+a1x+a0)t[x^{d + t}]\left(a_2x^2 + a_1x + a_0\right)^t

注意到这是一个多项式幂的形式。正常多项式快速幂的时间复杂度 O(tlogt)\mathcal{O}(t \log t)。但注意到该多项式次数较小,可以运用“少项式快速幂”的技巧。

少项式快速幂

少项式快速幂:给出一个次数不高的多项式 A(x)A(x),你需要求出 Ak(x)modxmA^k(x) \bmod x^m

A(x)=i=0naixi,Ak(x)=i=0m1bixiA(x) = \sum_{i = 0}^n a_ix^i, A^k(x) = \sum_{i = 0}^{m - 1}b_ix^i。考虑对 Ak(x)A^k(x) 求导

Ak(x)=kAk1(x)A(x)Ak(x)A(x)=kAk(x)A(x)A^k(x)' = kA^{k - 1}(x)A'(x) \\ {\color{blue}A^k(x)'}A(x) = k{\color{blue}A^{k}(x)}A'(x)

注意到 Ak(x)A^k(x)Ak(x)A^k(x)' 有一定的递推关系。具体地,考虑等式左右两边的 ii 次项

j=0i(j+1)bj+1aij=kj=0i(ij+1)aij+1bj\sum\limits_{j = 0}^i (j + 1)b_{j + 1}a_{i - j} = k\sum_{j = 0}^i(i - j + 1)a_{i - j + 1}b_j

等式左边只需枚举到 jinj \geq i - n,等式右边只需枚举到 jin+1j \geq i - n + 1。可以解得

bi+1=(kj=in+1i(ij+1)aij+1bj)(j=ini1(j+1)bj+1aij)(i+1)a0b_{i + 1} = \frac{\left( k\sum_{j = i - n + 1}^{i} (i - j + 1)a_{i - j + 1}b_j \right) - \left( \sum_{j = i - n}^{i - 1}(j + 1)b_{j + 1}a_{i - j} \right)}{(i + 1)a_0}

初值 b0=a0kb_0 = a_0^k,上式可以在已知 b0,b1,,bib_0, b_1, \cdots, b_i 的情况下递推出 bi+1b_{i + 1}

需要线性预处理出 1,2,,m11, 2, \cdots, m - 1 的逆元,递推式:i1pi(pmodi)1(modp)i^{-1} \equiv -\left\lfloor \frac{p}{i} \right\rfloor (p \bmod i)^{-1} \pmod{p}

时间复杂度 O(nm)\mathcal{O}(nm)当次数 nn 较小时有奇效

时间复杂度 O(VlogV+t)\mathcal{O}(V \log V + t),其中 VV 表示值域。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
481
482
483
484
#include <bits/stdc++.h>

#define debug(a) std::cout << #a << "=" << (a) << ' '

using s64 = long long;
using u64 = unsigned long long;

/* 取 min */
template <class T>
inline void chmin(T &x, const T &y) {
if (x > y) {
x = y;
}
}
/* 取 max */
template <class T>
inline void chmax(T &x, const T &y) {
if (x < y) {
x = y;
}
}

/* ----- ----- ----- 正文 ----- ----- ----- */

const int mod = 998244353; // 模数需根据实际问题调整

/* 模意义下 加法 */
inline void add(int &x, const int &y) {
x += y;
if (x >= mod) {
x -= mod;
}
}

/* 模意义下 减法 */
inline void dec(int &x, const int &y) {
x -= y;
if (x < 0) {
x += mod;
}
}

/* 模意义下 乘法 */
inline void mul(int &x, const int &y) {
x = 1ll * x * y % mod;
}

/* 快速幂 */
int qpow(int a, int b, int p) {
int ans = 1;
for (; b; b >>= 1) {
if (b & 1) ans = 1ll * ans * a % p;
a = 1ll * a * a % p;
}
return ans;
}

int L, P;
std::vector<int> rev;

void poly_init(const int &n) {
L = 1, P = 0;
while (L < n) L <<= 1, P ++;
rev.resize(L);
for (int i = 1; i < L; i ++) {
rev[i] = (rev[i >> 1] >> 1) | ((i & 1) << (P - 1));
}
}

void dft(std::vector<int> &a) {
int n = a.size();
for (int i = 0; i < n; i ++) {
if (i < rev[i]) {
std::swap(a[i], a[rev[i]]);
}
}
int g = 3;
for (int k = 1; k < n; k <<= 1) {
int omega = qpow(g, (mod - 1) / (k << 1), mod); // 2k 阶单位根
for (int i = 0; i < n; i += (k << 1)) {
int x = 1;
for (int j = 0; j < k; j ++, mul(x, omega)) {
int u = a[i + j], v = 1ll * x * a[i + j + k] % mod;
add(a[i + j] = u, v), dec(a[i + j + k] = u, v);
}
}
}
}

void idft(std::vector<int> &a) {
int n = a.size(), inv = qpow(n, mod - 2, mod);
std::reverse(a.begin() + 1, a.end());
dft(a);
for (int i = 0; i < n; i ++) {
mul(a[i], inv);
}
}

#define constexpr

/*
多项式全家桶(2025.09.17)
C++23 以上:请放心使用
C++11 ~ C++20:请删去所有的 constexpr(直接 #define constexpr 即可)
*/
struct poly : public std::vector<int> {
poly() : std::vector<int>() {}
explicit constexpr poly(int n) : std::vector<int>(n) {}
explicit constexpr poly(const std::vector<int> &a) : std::vector<int>(a) {}
constexpr poly(const std::initializer_list<int> &a) : std::vector<int>(a) {}

template <class InputIt, class = std::_RequireInputIter<InputIt>>
explicit constexpr poly(InputIt st, InputIt ed) : std::vector<int>(st, ed) {}

// 多项式乘法
constexpr friend poly operator * (poly a, poly b) {
int tot = a.size() + b.size() - 1;
if (tot < 128) {
poly c(tot);
for (int i = 0; i < a.size(); i ++) {
for (int j = 0; j < b.size(); j ++) {
c[i + j] = (c[i + j] + 1ll * a[i] * b[j]) % mod;
}
}
return c;
}
poly_init(tot);
a.resize(L), b.resize(L);
dft(a), dft(b);
for (int i = 0; i < L; i ++) {
mul(a[i], b[i]);
}
idft(a);
a.resize(tot);
return a;
}

// 多项式乘法(暴力)
constexpr friend poly mul_bf(poly a, poly b) {
poly c(a.size() + b.size() - 1);
for (int i = 0; i < a.size(); i ++) {
for (int j = 0; j < b.size(); j ++) {
c[i + j] = (c[i + j] + 1ll * a[i] * b[j]) % mod;
}
}
return c;
}
// 多项式除法(暴力)
constexpr friend poly div_bf(poly a, poly b) {
int m = b.size() - 1, inv = qpow(b[0], mod - 2, mod);
poly c(a.size() - b.size() + 1);
for (int i = 0; i < c.size(); i ++) {
c[i] = a[i];
for (int j = std::max(0, i - m); j < i; j ++) {
dec(c[i], 1ll * c[j] * b[i - j] % mod);
}
mul(c[i], inv);
}
return c;
}

constexpr friend poly operator + (poly a, poly b) {
poly c(std::max(a.size(), b.size()));
for (int i = 0; i < a.size(); i ++) {
add(c[i], a[i]);
}
for (int i = 0; i < b.size(); i ++) {
add(c[i], b[i]);
}
return c;
}
constexpr friend poly operator - (poly a, poly b) {
poly c(std::max(a.size(), b.size()));
for (int i = 0; i < a.size(); i ++) {
add(c[i], a[i]);
}
for (int i = 0; i < b.size(); i ++) {
dec(c[i], b[i]);
}
return c;
}
constexpr friend poly operator - (poly a) {
for (int &x : a) {
x = x ? mod - x : 0;
}
return a;
}

constexpr friend poly operator * (poly a, int b) {
for (int &x : a) {
mul(x, b);
}
return a;
}
constexpr friend poly operator / (poly a, int b) {
int inv = qpow(b, mod - 2, mod);
for (int &x : a) {
mul(x, inv);
}
return a;
}

constexpr poly &operator += (poly b) {
return (*this) = (*this) + b;
}
constexpr poly &operator -= (poly b) {
return (*this) = (*this) - b;
}
constexpr poly &operator *= (poly b) {
return (*this) = (*this) * b;
}
constexpr poly &operator *= (int b) {
return (*this) = (*this) * b;
}
constexpr poly &operator /= (int b) {
return (*this) = (*this) / b;
}

constexpr poly mulxk(int k) const {
auto res = *this;
res.insert(res.begin(), k, 0);
return res;
}
constexpr poly divxk(int k) const {
if (k >= size()) return poly();
return poly((*this).begin() + k, (*this).end());
}
constexpr poly modxk(int k) const {
if (k >= size()) return *this;
return poly((*this).begin(), (*this).begin() + k);
}

constexpr poly flip() const {
auto res = *this;
std::reverse(res.begin(), res.end());
return res;
}

constexpr poly mulT(poly b) const {
if (b.size() == 0) return poly();
std::reverse(b.begin(), b.end());
return ((*this) * b).divxk(b.size() - 1);
// 等价于“翻转卷积”,a.mulT(b) 相当于是求 a[i] * b[j] -> c[i - j]
}

// 多项式导数
constexpr poly deriv() const {
if (empty()) return poly();
poly res(size() - 1);
for (int i = 1; i < size(); i ++) {
res[i - 1] = 1ll * (*this)[i] * i % mod;
}
return res;
}

// 多项式积分
constexpr poly integ() const {
poly res(size() + 1);
for (int i = 0; i < size(); i ++) {
res[i + 1] = 1ll * (*this)[i] * qpow(i + 1, mod - 2, mod) % mod;
}
return res;
}

// 多项式求逆
constexpr poly inv(int m) const {
poly x{qpow((*this)[0], mod - 2, mod)};
int k = 1;
while (k < m) {
k <<= 1;
x = (x * (poly{2} - modxk(k) * x)).modxk(k);
}
return x.modxk(m);
}
// 少项式求逆
constexpr poly inv_bf(int m) const {
int n = size() - 1, inv = qpow((*this)[0], mod - 2, mod);
poly b(m);
for (int i = 0; i < m; i ++) {
b[i] = i == 0;
for (int j = std::max(0, i - n); j < i; j ++) {
dec(b[i], 1ll * b[j] * (*this)[i - j] % mod);
}
mul(b[i], inv);
}
return b;
}

// 多项式开方
constexpr poly sqrt(int m) const {
poly x{1}; // 默认常数项为 1
int k = 1;
while (k < m) {
k <<= 1;
x = (x + (modxk(k) * x.inv(k)).modxk(k)) / 2;
}
return x.modxk(m);
}

// 多项式带余除法
constexpr friend std::pair<poly, poly> divmod(poly a, poly b) {
int n = a.size(), m = b.size(), L = n - m + 1;
if (n < m) return {poly{0}, a};
poly q = (a.flip().modxk(L) * b.flip().inv(L)).modxk(L).flip();
poly r = a - b * q; while (r.size() && !r.back()) r.pop_back();
return {q, r};
}

// 多项式 ln
constexpr poly ln(int m) const { // 需要保证常数项为 1
return (deriv() * inv(m)).integ().modxk(m);
}

// 多项式 exp
constexpr poly exp(int m) const { // 需要保证常数项为 0
poly x{1};
int k = 1;
while (k < m) {
k <<= 1;
x = (x * (poly{1} - x.ln(k) + modxk(k))).modxk(k);
}
return x.modxk(m);
}

// 多项式快速幂
constexpr poly pow(int k, int m) const {
int i = 0;
while (i < size() && (*this)[i] == 0) {
i ++;
}
if (i == size() || 1ll * i * k >= m) {
return poly(m);
}
int v = (*this)[i];
poly f = divxk(i) * qpow(v, mod - 2, mod);
return (f.ln(m - i * k) * k).exp(m - i * k).mulxk(i * k) * qpow(v, k, mod);
/*
当实际 k < mod 时,可以放心使用
当实际 k >= mod 时,注意:
- 当 i > 0 时(即常数项为 0),直接返回长度为 m 的全 0 多项式
- 当 i = 0 时
- 在多项式 ln 与多项式 exp 部分,k 需要对 mod 取模
- 在 qpow(v, k, mod) 部分,k 需要对 mod - 1 取模
*/
}
// 少项式快速幂
constexpr poly pow_bf(int k, int m) const {
std::vector<int> v(m);
v[1] = 1;
for (int i = 2; i < m; i ++) {
v[i] = 1ll * v[mod % i] * (mod - mod / i) % mod;
}

int n = size() - 1, inv = qpow((*this)[0], mod - 2, mod);
poly b(m);
b[0] = qpow((*this)[0], k, mod);
for (int i = 0; i + 1 < m; i ++) {
b[i + 1] = 0;
for (int j = std::max(0, i - n + 1); j <= i; j ++) {
add(b[i + 1], 1ll * (i - j + 1) * (*this)[i - j + 1] % mod * b[j] % mod);
}
mul(b[i + 1], k);
for (int j = std::max(0, i - n); j < i; j ++) {
dec(b[i + 1], 1ll * (j + 1) * b[j + 1] % mod * (*this)[i - j] % mod);
}
mul(b[i + 1], v[i + 1]), mul(b[i + 1], inv);
}
return b;
}

// 多项式多点求值
constexpr std::vector<int> eval(std::vector<int> x) const {
if (size() == 0) {
return std::vector<int>(x.size(), 0);
}

int n = std::max(x.size(), this->size());
std::vector<poly> t(n * 4);
std::vector<int> ans(x.size());
x.resize(n);

std::function<void(int, int, int)> build = [&] (int p, int l, int r) {
if (l == r) {
int v = x[l];
t[p] = poly{1, v ? mod - v : 0};
return;
}
int mid = (l + r) >> 1;
build(p * 2, l, mid), build(p * 2 + 1, mid + 1, r);
t[p] = t[p * 2] * t[p * 2 + 1];
};
build(1, 0, n - 1);

std::function<void(int, int, int, const poly &)> solve = [&] (int p, int l, int r, const poly &num) {
if (l >= ans.size()) return;
if (l == r) {
ans[l] = num[0];
return;
}
int mid = (l + r) >> 1;
solve(p * 2, l, mid, num.mulT(t[p * 2 + 1]).modxk(mid - l + 1));
solve(p * 2 + 1, mid + 1, r, num.mulT(t[p * 2]).modxk(r - mid));
};
solve(1, 0, n - 1, mulT(t[1].inv(n)));

return ans;
}
};

// 多项式快速插值
constexpr poly lagrange(std::vector< std::pair<int, int> > seq) {
int n = seq.size();
std::vector<poly> t(n * 4);
std::vector<int> x(n);
for (int i = 0; i < n; i ++) {
x[i] = seq[i].first;
}

std::function<void(int, int, int)> build = [&] (int p, int l, int r) {
if (l == r) {
int v = x[l];
t[p] = poly{v ? mod - v : 0, 1};
return;
}
int mid = (l + r) >> 1;
build(p * 2, l, mid), build(p * 2 + 1, mid + 1, r);
t[p] = t[p * 2] * t[p * 2 + 1];
};
build(1, 0, n - 1);

auto res = (t[1].deriv()).eval(x);
std::function<poly(int, int, int)> solve = [&] (int p, int l, int r) {
if (l == r) {
int v = 1ll * seq[l].second * qpow(res[l], mod - 2, mod) % mod;
return poly{v};
}
int mid = (l + r) >> 1;
return solve(p * 2, l, mid) * t[p * 2 + 1] + solve(p * 2 + 1, mid + 1, r) * t[p * 2];
};
return solve(1, 0, n - 1);
}

const int sup = 1e6;

int n, t;

int main() {
std::ios::sync_with_stdio(0);
std::cin.tie(0);

std::cin >> n >> t;

poly buc(sup + 1);
for (int i = 1; i <= n; i ++) {
int x;
std::cin >> x;
buc[x] ++;
}

poly cnt = buc.mulT(buc);
dec(cnt[0], n), mul(cnt[0], qpow(2, mod - 2, mod));

int a0 = n - 2, a1 = (1ll * n * (n - 1) / 2 - 2 * (n - 2)) % mod, a2 = n - 2;
poly cost = poly{a0, a1, a2}.pow_bf(t, t * 2 + 1);

int ans = 0;
for (int i = 0; i <= sup; i ++) {
if (i + t >= cost.size()) break;
add(ans, 1ll * cnt[i] * cost[i + t] % mod);
}

mul(ans, qpow(qpow((1ll * n * (n - 1) / 2) % mod, t, mod), mod - 2, mod));

std::cout << ans << '\n';

return 0;
}

/**
* 心中无女人
* 比赛自然神
* 模板第一页
* 忘掉心上人
**/