AInstEmitSimdArithmetic.cs 35 KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179180181182183184185186187188189190191192193194195196197198199200201202203204205206207208209210211212213214215216217218219220221222223224225226227228229230231232233234235236237238239240241242243244245246247248249250251252253254255256257258259260261262263264265266267268269270271272273274275276277278279280281282283284285286287288289290291292293294295296297298299300301302303304305306307308309310311312313314315316317318319320321322323324325326327328329330331332333334335336337338339340341342343344345346347348349350351352353354355356357358359360361362363364365366367368369370371372373374375376377378379380381382383384385386387388389390391392393394395396397398399400401402403404405406407408409410411412413414415416417418419420421422423424425426427428429430431432433434435436437438439440441442443444445446447448449450451452453454455456457458459460461462463464465466467468469470471472473474475476477478479480481482483484485486487488489490491492493494495496497498499500501502503504505506507508509510511512513514515516517518519520521522523524525526527528529530531532533534535536537538539540541542543544545546547548549550551552553554555556557558559560561562563564565566567568569570571572573574575576577578579580581582583584585586587588589590591592593594595596597598599600601602603604605606607608609610611612613614615616617618619620621622623624625626627628629630631632633634635636637638639640641642643644645646647648649650651652653654655656657658659660661662663664665666667668669670671672673674675676677678679680681682683684685686687688689690691692693694695696697698699700701702703704705706707708709710711712713714715716717718719720721722723724725726727728729730731732733734735736737738739740741742743744745746747748749750751752753754755756757758759760761762763764765766767768769770771772773774775776777778779780781782783784785786787788789790791792793794795796797798799800801802803804805806807808809810811812813814815816817818819820821822823824825826827828829830831832833834835836837838839840841842843844845846847848849850851852853854855856857858859860861862863864865866867868869870871872873874875876877878879880881882883884885886887888889890891892893894895896897898899900901902903904905906907908909910911912913914915916917918919920921922923924925926927928929930931932933934935936937938939940941942943944945946947948949950951952953954955956957958959960961962963964965966967968969970971972973974975976977978979980981982983984985986987988989990991992993994995996997998999100010011002100310041005100610071008100910101011101210131014101510161017101810191020102110221023102410251026102710281029103010311032103310341035103610371038103910401041104210431044104510461047104810491050105110521053105410551056105710581059106010611062106310641065106610671068106910701071107210731074107510761077107810791080108110821083108410851086108710881089109010911092109310941095109610971098109911001101110211031104110511061107110811091110111111121113111411151116111711181119112011211122112311241125112611271128112911301131113211331134113511361137113811391140114111421143114411451146114711481149115011511152115311541155115611571158115911601161116211631164116511661167116811691170117111721173117411751176117711781179118011811182118311841185118611871188118911901191119211931194119511961197119811991200120112021203120412051206120712081209121012111212121312141215121612171218121912201221122212231224122512261227122812291230123112321233123412351236123712381239
  1. using ChocolArm64.Decoder;
  2. using ChocolArm64.State;
  3. using ChocolArm64.Translation;
  4. using System;
  5. using System.Reflection;
  6. using System.Reflection.Emit;
  7. using System.Runtime.Intrinsics.X86;
  8. using static ChocolArm64.Instruction.AInstEmitSimdHelper;
  9. namespace ChocolArm64.Instruction
  10. {
  11. static partial class AInstEmit
  12. {
  13. public static void Abs_S(AILEmitterCtx Context)
  14. {
  15. EmitScalarUnaryOpSx(Context, () => EmitAbs(Context));
  16. }
  17. public static void Abs_V(AILEmitterCtx Context)
  18. {
  19. EmitVectorUnaryOpSx(Context, () => EmitAbs(Context));
  20. }
  21. public static void Add_S(AILEmitterCtx Context)
  22. {
  23. EmitScalarBinaryOpZx(Context, () => Context.Emit(OpCodes.Add));
  24. }
  25. public static void Add_V(AILEmitterCtx Context)
  26. {
  27. if (AOptimizations.UseSse2)
  28. {
  29. EmitSse2Call(Context, nameof(Sse2.Add));
  30. }
  31. else
  32. {
  33. EmitVectorBinaryOpZx(Context, () => Context.Emit(OpCodes.Add));
  34. }
  35. }
  36. public static void Addhn_V(AILEmitterCtx Context)
  37. {
  38. EmitHighNarrow(Context, () => Context.Emit(OpCodes.Add), Round: false);
  39. }
  40. public static void Addp_S(AILEmitterCtx Context)
  41. {
  42. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  43. EmitVectorExtractZx(Context, Op.Rn, 0, Op.Size);
  44. EmitVectorExtractZx(Context, Op.Rn, 1, Op.Size);
  45. Context.Emit(OpCodes.Add);
  46. EmitScalarSet(Context, Op.Rd, Op.Size);
  47. }
  48. public static void Addp_V(AILEmitterCtx Context)
  49. {
  50. EmitVectorPairwiseOpZx(Context, () => Context.Emit(OpCodes.Add));
  51. }
  52. public static void Addv_V(AILEmitterCtx Context)
  53. {
  54. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  55. int Bytes = Op.GetBitsCount() >> 3;
  56. int Elems = Bytes >> Op.Size;
  57. EmitVectorExtractZx(Context, Op.Rn, 0, Op.Size);
  58. for (int Index = 1; Index < Elems; Index++)
  59. {
  60. EmitVectorExtractZx(Context, Op.Rn, Index, Op.Size);
  61. Context.Emit(OpCodes.Add);
  62. }
  63. EmitScalarSet(Context, Op.Rd, Op.Size);
  64. }
  65. public static void Cls_V(AILEmitterCtx Context)
  66. {
  67. MethodInfo MthdInfo = typeof(ASoftFallback).GetMethod(nameof(ASoftFallback.CountLeadingSigns));
  68. EmitCountLeadingBits(Context, () => Context.EmitCall(MthdInfo));
  69. }
  70. public static void Clz_V(AILEmitterCtx Context)
  71. {
  72. MethodInfo MthdInfo = typeof(ASoftFallback).GetMethod(nameof(ASoftFallback.CountLeadingZeros));
  73. EmitCountLeadingBits(Context, () => Context.EmitCall(MthdInfo));
  74. }
  75. private static void EmitCountLeadingBits(AILEmitterCtx Context, Action Emit)
  76. {
  77. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  78. int Bytes = Op.GetBitsCount() >> 3;
  79. int Elems = Bytes >> Op.Size;
  80. int ESize = 8 << Op.Size;
  81. for (int Index = 0; Index < Elems; Index++)
  82. {
  83. EmitVectorExtractZx(Context, Op.Rn, Index, Op.Size);
  84. Context.EmitLdc_I4(ESize);
  85. Emit();
  86. EmitVectorInsert(Context, Op.Rd, Index, Op.Size);
  87. }
  88. if (Op.RegisterSize == ARegisterSize.SIMD64)
  89. {
  90. EmitVectorZeroUpper(Context, Op.Rd);
  91. }
  92. }
  93. public static void Cnt_V(AILEmitterCtx Context)
  94. {
  95. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  96. int Elems = Op.RegisterSize == ARegisterSize.SIMD128 ? 16 : 8;
  97. for (int Index = 0; Index < Elems; Index++)
  98. {
  99. EmitVectorExtractZx(Context, Op.Rn, Index, 0);
  100. Context.Emit(OpCodes.Conv_U4);
  101. ASoftFallback.EmitCall(Context, nameof(ASoftFallback.CountSetBits8));
  102. Context.Emit(OpCodes.Conv_U8);
  103. EmitVectorInsert(Context, Op.Rd, Index, 0);
  104. }
  105. if (Op.RegisterSize == ARegisterSize.SIMD64)
  106. {
  107. EmitVectorZeroUpper(Context, Op.Rd);
  108. }
  109. }
  110. private static void EmitAbs(AILEmitterCtx Context)
  111. {
  112. AILLabel LblTrue = new AILLabel();
  113. Context.Emit(OpCodes.Dup);
  114. Context.Emit(OpCodes.Ldc_I4_0);
  115. Context.Emit(OpCodes.Bge_S, LblTrue);
  116. Context.Emit(OpCodes.Neg);
  117. Context.MarkLabel(LblTrue);
  118. }
  119. private static void EmitHighNarrow(AILEmitterCtx Context, Action Emit, bool Round)
  120. {
  121. AOpCodeSimdReg Op = (AOpCodeSimdReg)Context.CurrOp;
  122. int Elems = 8 >> Op.Size;
  123. int ESize = 8 << Op.Size;
  124. int Part = Op.RegisterSize == ARegisterSize.SIMD128 ? Elems : 0;
  125. long RoundConst = 1L << (ESize - 1);
  126. if (Part != 0)
  127. {
  128. Context.EmitLdvec(Op.Rd);
  129. Context.EmitStvectmp();
  130. }
  131. for (int Index = 0; Index < Elems; Index++)
  132. {
  133. EmitVectorExtractZx(Context, Op.Rn, Index, Op.Size + 1);
  134. EmitVectorExtractZx(Context, Op.Rm, Index, Op.Size + 1);
  135. Emit();
  136. if (Round)
  137. {
  138. Context.EmitLdc_I8(RoundConst);
  139. Context.Emit(OpCodes.Add);
  140. }
  141. Context.EmitLsr(ESize);
  142. EmitVectorInsertTmp(Context, Part + Index, Op.Size);
  143. }
  144. Context.EmitLdvectmp();
  145. Context.EmitStvec(Op.Rd);
  146. if (Part == 0)
  147. {
  148. EmitVectorZeroUpper(Context, Op.Rd);
  149. }
  150. }
  151. public static void Fabd_S(AILEmitterCtx Context)
  152. {
  153. EmitScalarBinaryOpF(Context, () =>
  154. {
  155. Context.Emit(OpCodes.Sub);
  156. EmitUnaryMathCall(Context, nameof(Math.Abs));
  157. });
  158. }
  159. public static void Fabs_S(AILEmitterCtx Context)
  160. {
  161. EmitScalarUnaryOpF(Context, () =>
  162. {
  163. EmitUnaryMathCall(Context, nameof(Math.Abs));
  164. });
  165. }
  166. public static void Fabs_V(AILEmitterCtx Context)
  167. {
  168. EmitVectorUnaryOpF(Context, () =>
  169. {
  170. EmitUnaryMathCall(Context, nameof(Math.Abs));
  171. });
  172. }
  173. public static void Fadd_S(AILEmitterCtx Context)
  174. {
  175. if (AOptimizations.UseSse && AOptimizations.UseSse2)
  176. {
  177. EmitSseOrSse2CallF(Context, nameof(Sse.AddScalar));
  178. }
  179. else
  180. {
  181. EmitScalarBinaryOpF(Context, () => Context.Emit(OpCodes.Add));
  182. }
  183. }
  184. public static void Fadd_V(AILEmitterCtx Context)
  185. {
  186. if (AOptimizations.UseSse && AOptimizations.UseSse2)
  187. {
  188. EmitSseOrSse2CallF(Context, nameof(Sse.Add));
  189. }
  190. else
  191. {
  192. EmitVectorBinaryOpF(Context, () => Context.Emit(OpCodes.Add));
  193. }
  194. }
  195. public static void Faddp_S(AILEmitterCtx Context)
  196. {
  197. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  198. int SizeF = Op.Size & 1;
  199. EmitVectorExtractF(Context, Op.Rn, 0, SizeF);
  200. EmitVectorExtractF(Context, Op.Rn, 1, SizeF);
  201. Context.Emit(OpCodes.Add);
  202. EmitScalarSetF(Context, Op.Rd, SizeF);
  203. }
  204. public static void Faddp_V(AILEmitterCtx Context)
  205. {
  206. AOpCodeSimdReg Op = (AOpCodeSimdReg)Context.CurrOp;
  207. int SizeF = Op.Size & 1;
  208. int Bytes = Op.GetBitsCount() >> 3;
  209. int Elems = Bytes >> SizeF + 2;
  210. int Half = Elems >> 1;
  211. for (int Index = 0; Index < Elems; Index++)
  212. {
  213. int Elem = (Index & (Half - 1)) << 1;
  214. EmitVectorExtractF(Context, Index < Half ? Op.Rn : Op.Rm, Elem + 0, SizeF);
  215. EmitVectorExtractF(Context, Index < Half ? Op.Rn : Op.Rm, Elem + 1, SizeF);
  216. Context.Emit(OpCodes.Add);
  217. EmitVectorInsertTmpF(Context, Index, SizeF);
  218. }
  219. Context.EmitLdvectmp();
  220. Context.EmitStvec(Op.Rd);
  221. if (Op.RegisterSize == ARegisterSize.SIMD64)
  222. {
  223. EmitVectorZeroUpper(Context, Op.Rd);
  224. }
  225. }
  226. public static void Fdiv_S(AILEmitterCtx Context)
  227. {
  228. if (AOptimizations.UseSse && AOptimizations.UseSse2)
  229. {
  230. EmitSseOrSse2CallF(Context, nameof(Sse.DivideScalar));
  231. }
  232. else
  233. {
  234. EmitScalarBinaryOpF(Context, () => Context.Emit(OpCodes.Div));
  235. }
  236. }
  237. public static void Fdiv_V(AILEmitterCtx Context)
  238. {
  239. if (AOptimizations.UseSse && AOptimizations.UseSse2)
  240. {
  241. EmitSseOrSse2CallF(Context, nameof(Sse.Divide));
  242. }
  243. else
  244. {
  245. EmitVectorBinaryOpF(Context, () => Context.Emit(OpCodes.Div));
  246. }
  247. }
  248. public static void Fmadd_S(AILEmitterCtx Context)
  249. {
  250. EmitScalarTernaryRaOpF(Context, () =>
  251. {
  252. Context.Emit(OpCodes.Mul);
  253. Context.Emit(OpCodes.Add);
  254. });
  255. }
  256. public static void Fmax_S(AILEmitterCtx Context)
  257. {
  258. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  259. EmitScalarBinaryOpF(Context, () =>
  260. {
  261. if (Op.Size == 0)
  262. {
  263. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.MaxF));
  264. }
  265. else if (Op.Size == 1)
  266. {
  267. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.Max));
  268. }
  269. else
  270. {
  271. throw new InvalidOperationException();
  272. }
  273. });
  274. }
  275. public static void Fmax_V(AILEmitterCtx Context)
  276. {
  277. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  278. EmitVectorBinaryOpF(Context, () =>
  279. {
  280. if (Op.Size == 0)
  281. {
  282. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.MaxF));
  283. }
  284. else if (Op.Size == 1)
  285. {
  286. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.Max));
  287. }
  288. else
  289. {
  290. throw new InvalidOperationException();
  291. }
  292. });
  293. }
  294. public static void Fmin_S(AILEmitterCtx Context)
  295. {
  296. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  297. EmitScalarBinaryOpF(Context, () =>
  298. {
  299. if (Op.Size == 0)
  300. {
  301. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.MinF));
  302. }
  303. else if (Op.Size == 1)
  304. {
  305. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.Min));
  306. }
  307. else
  308. {
  309. throw new InvalidOperationException();
  310. }
  311. });
  312. }
  313. public static void Fmin_V(AILEmitterCtx Context)
  314. {
  315. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  316. int SizeF = Op.Size & 1;
  317. EmitVectorBinaryOpF(Context, () =>
  318. {
  319. if (SizeF == 0)
  320. {
  321. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.MinF));
  322. }
  323. else if (SizeF == 1)
  324. {
  325. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.Min));
  326. }
  327. else
  328. {
  329. throw new InvalidOperationException();
  330. }
  331. });
  332. }
  333. public static void Fmaxnm_S(AILEmitterCtx Context)
  334. {
  335. Fmax_S(Context);
  336. }
  337. public static void Fminnm_S(AILEmitterCtx Context)
  338. {
  339. Fmin_S(Context);
  340. }
  341. public static void Fmla_Se(AILEmitterCtx Context)
  342. {
  343. EmitScalarTernaryOpByElemF(Context, () =>
  344. {
  345. Context.Emit(OpCodes.Mul);
  346. Context.Emit(OpCodes.Add);
  347. });
  348. }
  349. public static void Fmla_V(AILEmitterCtx Context)
  350. {
  351. EmitVectorTernaryOpF(Context, () =>
  352. {
  353. Context.Emit(OpCodes.Mul);
  354. Context.Emit(OpCodes.Add);
  355. });
  356. }
  357. public static void Fmla_Ve(AILEmitterCtx Context)
  358. {
  359. EmitVectorTernaryOpByElemF(Context, () =>
  360. {
  361. Context.Emit(OpCodes.Mul);
  362. Context.Emit(OpCodes.Add);
  363. });
  364. }
  365. public static void Fmls_V(AILEmitterCtx Context)
  366. {
  367. EmitVectorTernaryOpF(Context, () =>
  368. {
  369. Context.Emit(OpCodes.Mul);
  370. Context.Emit(OpCodes.Sub);
  371. });
  372. }
  373. public static void Fmls_Ve(AILEmitterCtx Context)
  374. {
  375. EmitVectorTernaryOpByElemF(Context, () =>
  376. {
  377. Context.Emit(OpCodes.Mul);
  378. Context.Emit(OpCodes.Sub);
  379. });
  380. }
  381. public static void Fmsub_S(AILEmitterCtx Context)
  382. {
  383. EmitScalarTernaryRaOpF(Context, () =>
  384. {
  385. Context.Emit(OpCodes.Mul);
  386. Context.Emit(OpCodes.Sub);
  387. });
  388. }
  389. public static void Fmul_S(AILEmitterCtx Context)
  390. {
  391. if (AOptimizations.UseSse && AOptimizations.UseSse2)
  392. {
  393. EmitSseOrSse2CallF(Context, nameof(Sse.MultiplyScalar));
  394. }
  395. else
  396. {
  397. EmitScalarBinaryOpF(Context, () => Context.Emit(OpCodes.Mul));
  398. }
  399. }
  400. public static void Fmul_Se(AILEmitterCtx Context)
  401. {
  402. EmitScalarBinaryOpByElemF(Context, () => Context.Emit(OpCodes.Mul));
  403. }
  404. public static void Fmul_V(AILEmitterCtx Context)
  405. {
  406. if (AOptimizations.UseSse && AOptimizations.UseSse2)
  407. {
  408. EmitSseOrSse2CallF(Context, nameof(Sse.Multiply));
  409. }
  410. else
  411. {
  412. EmitVectorBinaryOpF(Context, () => Context.Emit(OpCodes.Mul));
  413. }
  414. }
  415. public static void Fmul_Ve(AILEmitterCtx Context)
  416. {
  417. EmitVectorBinaryOpByElemF(Context, () => Context.Emit(OpCodes.Mul));
  418. }
  419. public static void Fneg_S(AILEmitterCtx Context)
  420. {
  421. EmitScalarUnaryOpF(Context, () => Context.Emit(OpCodes.Neg));
  422. }
  423. public static void Fneg_V(AILEmitterCtx Context)
  424. {
  425. EmitVectorUnaryOpF(Context, () => Context.Emit(OpCodes.Neg));
  426. }
  427. public static void Fnmadd_S(AILEmitterCtx Context)
  428. {
  429. AOpCodeSimdReg Op = (AOpCodeSimdReg)Context.CurrOp;
  430. int SizeF = Op.Size & 1;
  431. EmitVectorExtractF(Context, Op.Rn, 0, SizeF);
  432. Context.Emit(OpCodes.Neg);
  433. EmitVectorExtractF(Context, Op.Rm, 0, SizeF);
  434. Context.Emit(OpCodes.Mul);
  435. EmitVectorExtractF(Context, Op.Ra, 0, SizeF);
  436. Context.Emit(OpCodes.Sub);
  437. EmitScalarSetF(Context, Op.Rd, SizeF);
  438. }
  439. public static void Fnmsub_S(AILEmitterCtx Context)
  440. {
  441. AOpCodeSimdReg Op = (AOpCodeSimdReg)Context.CurrOp;
  442. int SizeF = Op.Size & 1;
  443. EmitVectorExtractF(Context, Op.Rn, 0, SizeF);
  444. EmitVectorExtractF(Context, Op.Rm, 0, SizeF);
  445. Context.Emit(OpCodes.Mul);
  446. EmitVectorExtractF(Context, Op.Ra, 0, SizeF);
  447. Context.Emit(OpCodes.Sub);
  448. EmitScalarSetF(Context, Op.Rd, SizeF);
  449. }
  450. public static void Fnmul_S(AILEmitterCtx Context)
  451. {
  452. EmitScalarBinaryOpF(Context, () =>
  453. {
  454. Context.Emit(OpCodes.Mul);
  455. Context.Emit(OpCodes.Neg);
  456. });
  457. }
  458. public static void Frecpe_S(AILEmitterCtx Context)
  459. {
  460. EmitScalarUnaryOpF(Context, () =>
  461. {
  462. EmitUnarySoftFloatCall(Context, nameof(ASoftFloat.RecipEstimate));
  463. });
  464. }
  465. public static void Frecpe_V(AILEmitterCtx Context)
  466. {
  467. EmitVectorUnaryOpF(Context, () =>
  468. {
  469. EmitUnarySoftFloatCall(Context, nameof(ASoftFloat.RecipEstimate));
  470. });
  471. }
  472. public static void Frecps_S(AILEmitterCtx Context)
  473. {
  474. EmitScalarBinaryOpF(Context, () =>
  475. {
  476. EmitBinarySoftFloatCall(Context, nameof(ASoftFloat.RecipStep));
  477. });
  478. }
  479. public static void Frecps_V(AILEmitterCtx Context)
  480. {
  481. EmitVectorBinaryOpF(Context, () =>
  482. {
  483. EmitBinarySoftFloatCall(Context, nameof(ASoftFloat.RecipStep));
  484. });
  485. }
  486. public static void Frinta_S(AILEmitterCtx Context)
  487. {
  488. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  489. EmitVectorExtractF(Context, Op.Rn, 0, Op.Size);
  490. EmitRoundMathCall(Context, MidpointRounding.AwayFromZero);
  491. EmitScalarSetF(Context, Op.Rd, Op.Size);
  492. }
  493. public static void Frinta_V(AILEmitterCtx Context)
  494. {
  495. EmitVectorUnaryOpF(Context, () =>
  496. {
  497. EmitRoundMathCall(Context, MidpointRounding.AwayFromZero);
  498. });
  499. }
  500. public static void Frinti_S(AILEmitterCtx Context)
  501. {
  502. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  503. EmitScalarUnaryOpF(Context, () =>
  504. {
  505. Context.EmitLdarg(ATranslatedSub.StateArgIdx);
  506. Context.EmitCallPropGet(typeof(AThreadState), nameof(AThreadState.Fpcr));
  507. if (Op.Size == 0)
  508. {
  509. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.RoundF));
  510. }
  511. else if (Op.Size == 1)
  512. {
  513. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.Round));
  514. }
  515. else
  516. {
  517. throw new InvalidOperationException();
  518. }
  519. });
  520. }
  521. public static void Frinti_V(AILEmitterCtx Context)
  522. {
  523. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  524. int SizeF = Op.Size & 1;
  525. EmitVectorUnaryOpF(Context, () =>
  526. {
  527. Context.EmitLdarg(ATranslatedSub.StateArgIdx);
  528. Context.EmitCallPropGet(typeof(AThreadState), nameof(AThreadState.Fpcr));
  529. if (SizeF == 0)
  530. {
  531. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.RoundF));
  532. }
  533. else if (SizeF == 1)
  534. {
  535. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.Round));
  536. }
  537. else
  538. {
  539. throw new InvalidOperationException();
  540. }
  541. });
  542. }
  543. public static void Frintm_S(AILEmitterCtx Context)
  544. {
  545. EmitScalarUnaryOpF(Context, () =>
  546. {
  547. EmitUnaryMathCall(Context, nameof(Math.Floor));
  548. });
  549. }
  550. public static void Frintm_V(AILEmitterCtx Context)
  551. {
  552. EmitVectorUnaryOpF(Context, () =>
  553. {
  554. EmitUnaryMathCall(Context, nameof(Math.Floor));
  555. });
  556. }
  557. public static void Frintn_S(AILEmitterCtx Context)
  558. {
  559. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  560. EmitVectorExtractF(Context, Op.Rn, 0, Op.Size);
  561. EmitRoundMathCall(Context, MidpointRounding.ToEven);
  562. EmitScalarSetF(Context, Op.Rd, Op.Size);
  563. }
  564. public static void Frintn_V(AILEmitterCtx Context)
  565. {
  566. EmitVectorUnaryOpF(Context, () =>
  567. {
  568. EmitRoundMathCall(Context, MidpointRounding.ToEven);
  569. });
  570. }
  571. public static void Frintp_S(AILEmitterCtx Context)
  572. {
  573. EmitScalarUnaryOpF(Context, () =>
  574. {
  575. EmitUnaryMathCall(Context, nameof(Math.Ceiling));
  576. });
  577. }
  578. public static void Frintp_V(AILEmitterCtx Context)
  579. {
  580. EmitVectorUnaryOpF(Context, () =>
  581. {
  582. EmitUnaryMathCall(Context, nameof(Math.Ceiling));
  583. });
  584. }
  585. public static void Frintx_S(AILEmitterCtx Context)
  586. {
  587. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  588. EmitScalarUnaryOpF(Context, () =>
  589. {
  590. Context.EmitLdarg(ATranslatedSub.StateArgIdx);
  591. Context.EmitCallPropGet(typeof(AThreadState), nameof(AThreadState.Fpcr));
  592. if (Op.Size == 0)
  593. {
  594. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.RoundF));
  595. }
  596. else if (Op.Size == 1)
  597. {
  598. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.Round));
  599. }
  600. else
  601. {
  602. throw new InvalidOperationException();
  603. }
  604. });
  605. }
  606. public static void Frintx_V(AILEmitterCtx Context)
  607. {
  608. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  609. EmitVectorUnaryOpF(Context, () =>
  610. {
  611. Context.EmitLdarg(ATranslatedSub.StateArgIdx);
  612. Context.EmitCallPropGet(typeof(AThreadState), nameof(AThreadState.Fpcr));
  613. if (Op.Size == 0)
  614. {
  615. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.RoundF));
  616. }
  617. else if (Op.Size == 1)
  618. {
  619. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.Round));
  620. }
  621. else
  622. {
  623. throw new InvalidOperationException();
  624. }
  625. });
  626. }
  627. public static void Frsqrte_S(AILEmitterCtx Context)
  628. {
  629. EmitScalarUnaryOpF(Context, () =>
  630. {
  631. EmitUnarySoftFloatCall(Context, nameof(ASoftFloat.InvSqrtEstimate));
  632. });
  633. }
  634. public static void Frsqrte_V(AILEmitterCtx Context)
  635. {
  636. EmitVectorUnaryOpF(Context, () =>
  637. {
  638. EmitUnarySoftFloatCall(Context, nameof(ASoftFloat.InvSqrtEstimate));
  639. });
  640. }
  641. public static void Frsqrts_S(AILEmitterCtx Context)
  642. {
  643. EmitFrsqrts(Context, 0, Scalar: true);
  644. }
  645. public static void Frsqrts_V(AILEmitterCtx Context)
  646. {
  647. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  648. int SizeF = Op.Size & 1;
  649. int Bytes = Op.GetBitsCount() >> 3;
  650. for (int Index = 0; Index < Bytes >> SizeF + 2; Index++)
  651. {
  652. EmitFrsqrts(Context, Index, Scalar: false);
  653. }
  654. if (Op.RegisterSize == ARegisterSize.SIMD64)
  655. {
  656. EmitVectorZeroUpper(Context, Op.Rd);
  657. }
  658. }
  659. private static void EmitFrsqrts(AILEmitterCtx Context, int Index, bool Scalar)
  660. {
  661. AOpCodeSimdReg Op = (AOpCodeSimdReg)Context.CurrOp;
  662. int SizeF = Op.Size & 1;
  663. if (SizeF == 0)
  664. {
  665. Context.EmitLdc_R4(3);
  666. }
  667. else /* if (SizeF == 1) */
  668. {
  669. Context.EmitLdc_R8(3);
  670. }
  671. EmitVectorExtractF(Context, Op.Rn, Index, SizeF);
  672. EmitVectorExtractF(Context, Op.Rm, Index, SizeF);
  673. Context.Emit(OpCodes.Mul);
  674. Context.Emit(OpCodes.Sub);
  675. if (SizeF == 0)
  676. {
  677. Context.EmitLdc_R4(0.5f);
  678. }
  679. else /* if (SizeF == 1) */
  680. {
  681. Context.EmitLdc_R8(0.5);
  682. }
  683. Context.Emit(OpCodes.Mul);
  684. if (Scalar)
  685. {
  686. EmitVectorZeroAll(Context, Op.Rd);
  687. }
  688. EmitVectorInsertF(Context, Op.Rd, Index, SizeF);
  689. }
  690. public static void Fsqrt_S(AILEmitterCtx Context)
  691. {
  692. EmitScalarUnaryOpF(Context, () =>
  693. {
  694. EmitUnaryMathCall(Context, nameof(Math.Sqrt));
  695. });
  696. }
  697. public static void Fsub_S(AILEmitterCtx Context)
  698. {
  699. if (AOptimizations.UseSse && AOptimizations.UseSse2)
  700. {
  701. EmitSseOrSse2CallF(Context, nameof(Sse.SubtractScalar));
  702. }
  703. else
  704. {
  705. EmitScalarBinaryOpF(Context, () => Context.Emit(OpCodes.Sub));
  706. }
  707. }
  708. public static void Fsub_V(AILEmitterCtx Context)
  709. {
  710. if (AOptimizations.UseSse && AOptimizations.UseSse2)
  711. {
  712. EmitSseOrSse2CallF(Context, nameof(Sse.Subtract));
  713. }
  714. else
  715. {
  716. EmitVectorBinaryOpF(Context, () => Context.Emit(OpCodes.Sub));
  717. }
  718. }
  719. public static void Mla_V(AILEmitterCtx Context)
  720. {
  721. EmitVectorTernaryOpZx(Context, () =>
  722. {
  723. Context.Emit(OpCodes.Mul);
  724. Context.Emit(OpCodes.Add);
  725. });
  726. }
  727. public static void Mla_Ve(AILEmitterCtx Context)
  728. {
  729. EmitVectorTernaryOpByElemZx(Context, () =>
  730. {
  731. Context.Emit(OpCodes.Mul);
  732. Context.Emit(OpCodes.Add);
  733. });
  734. }
  735. public static void Mls_V(AILEmitterCtx Context)
  736. {
  737. EmitVectorTernaryOpZx(Context, () =>
  738. {
  739. Context.Emit(OpCodes.Mul);
  740. Context.Emit(OpCodes.Sub);
  741. });
  742. }
  743. public static void Mul_V(AILEmitterCtx Context)
  744. {
  745. EmitVectorBinaryOpZx(Context, () => Context.Emit(OpCodes.Mul));
  746. }
  747. public static void Mul_Ve(AILEmitterCtx Context)
  748. {
  749. EmitVectorBinaryOpByElemZx(Context, () => Context.Emit(OpCodes.Mul));
  750. }
  751. public static void Neg_S(AILEmitterCtx Context)
  752. {
  753. EmitScalarUnaryOpSx(Context, () => Context.Emit(OpCodes.Neg));
  754. }
  755. public static void Neg_V(AILEmitterCtx Context)
  756. {
  757. EmitVectorUnaryOpSx(Context, () => Context.Emit(OpCodes.Neg));
  758. }
  759. public static void Raddhn_V(AILEmitterCtx Context)
  760. {
  761. EmitHighNarrow(Context, () => Context.Emit(OpCodes.Add), Round: true);
  762. }
  763. public static void Rsubhn_V(AILEmitterCtx Context)
  764. {
  765. EmitHighNarrow(Context, () => Context.Emit(OpCodes.Sub), Round: true);
  766. }
  767. public static void Saba_V(AILEmitterCtx Context)
  768. {
  769. EmitVectorTernaryOpSx(Context, () =>
  770. {
  771. Context.Emit(OpCodes.Sub);
  772. EmitAbs(Context);
  773. Context.Emit(OpCodes.Add);
  774. });
  775. }
  776. public static void Sabal_V(AILEmitterCtx Context)
  777. {
  778. EmitVectorWidenRnRmTernaryOpSx(Context, () =>
  779. {
  780. Context.Emit(OpCodes.Sub);
  781. EmitAbs(Context);
  782. Context.Emit(OpCodes.Add);
  783. });
  784. }
  785. public static void Sabd_V(AILEmitterCtx Context)
  786. {
  787. EmitVectorBinaryOpSx(Context, () =>
  788. {
  789. Context.Emit(OpCodes.Sub);
  790. EmitAbs(Context);
  791. });
  792. }
  793. public static void Sabdl_V(AILEmitterCtx Context)
  794. {
  795. EmitVectorWidenRnRmBinaryOpSx(Context, () =>
  796. {
  797. Context.Emit(OpCodes.Sub);
  798. EmitAbs(Context);
  799. });
  800. }
  801. public static void Saddw_V(AILEmitterCtx Context)
  802. {
  803. EmitVectorWidenRmBinaryOpSx(Context, () => Context.Emit(OpCodes.Add));
  804. }
  805. public static void Smax_V(AILEmitterCtx Context)
  806. {
  807. Type[] Types = new Type[] { typeof(long), typeof(long) };
  808. MethodInfo MthdInfo = typeof(Math).GetMethod(nameof(Math.Max), Types);
  809. EmitVectorBinaryOpSx(Context, () => Context.EmitCall(MthdInfo));
  810. }
  811. public static void Smaxp_V(AILEmitterCtx Context)
  812. {
  813. Type[] Types = new Type[] { typeof(long), typeof(long) };
  814. MethodInfo MthdInfo = typeof(Math).GetMethod(nameof(Math.Max), Types);
  815. EmitVectorPairwiseOpSx(Context, () => Context.EmitCall(MthdInfo));
  816. }
  817. public static void Smin_V(AILEmitterCtx Context)
  818. {
  819. Type[] Types = new Type[] { typeof(long), typeof(long) };
  820. MethodInfo MthdInfo = typeof(Math).GetMethod(nameof(Math.Min), Types);
  821. EmitVectorBinaryOpSx(Context, () => Context.EmitCall(MthdInfo));
  822. }
  823. public static void Sminp_V(AILEmitterCtx Context)
  824. {
  825. Type[] Types = new Type[] { typeof(long), typeof(long) };
  826. MethodInfo MthdInfo = typeof(Math).GetMethod(nameof(Math.Min), Types);
  827. EmitVectorPairwiseOpSx(Context, () => Context.EmitCall(MthdInfo));
  828. }
  829. public static void Smlal_V(AILEmitterCtx Context)
  830. {
  831. EmitVectorWidenRnRmTernaryOpSx(Context, () =>
  832. {
  833. Context.Emit(OpCodes.Mul);
  834. Context.Emit(OpCodes.Add);
  835. });
  836. }
  837. public static void Smlsl_V(AILEmitterCtx Context)
  838. {
  839. EmitVectorWidenRnRmTernaryOpSx(Context, () =>
  840. {
  841. Context.Emit(OpCodes.Mul);
  842. Context.Emit(OpCodes.Sub);
  843. });
  844. }
  845. public static void Smull_V(AILEmitterCtx Context)
  846. {
  847. EmitVectorWidenRnRmBinaryOpSx(Context, () => Context.Emit(OpCodes.Mul));
  848. }
  849. public static void Sqxtn_S(AILEmitterCtx Context)
  850. {
  851. EmitScalarSaturatingNarrowOpSxSx(Context, () => { });
  852. }
  853. public static void Sqxtn_V(AILEmitterCtx Context)
  854. {
  855. EmitVectorSaturatingNarrowOpSxSx(Context, () => { });
  856. }
  857. public static void Sqxtun_S(AILEmitterCtx Context)
  858. {
  859. EmitScalarSaturatingNarrowOpSxZx(Context, () => { });
  860. }
  861. public static void Sqxtun_V(AILEmitterCtx Context)
  862. {
  863. EmitVectorSaturatingNarrowOpSxZx(Context, () => { });
  864. }
  865. public static void Ssubw_V(AILEmitterCtx Context)
  866. {
  867. EmitVectorWidenRmBinaryOpSx(Context, () => Context.Emit(OpCodes.Sub));
  868. }
  869. public static void Sub_S(AILEmitterCtx Context)
  870. {
  871. EmitScalarBinaryOpZx(Context, () => Context.Emit(OpCodes.Sub));
  872. }
  873. public static void Sub_V(AILEmitterCtx Context)
  874. {
  875. if (AOptimizations.UseSse2)
  876. {
  877. EmitSse2Call(Context, nameof(Sse2.Subtract));
  878. }
  879. else
  880. {
  881. EmitVectorBinaryOpZx(Context, () => Context.Emit(OpCodes.Sub));
  882. }
  883. }
  884. public static void Subhn_V(AILEmitterCtx Context)
  885. {
  886. EmitHighNarrow(Context, () => Context.Emit(OpCodes.Sub), Round: false);
  887. }
  888. public static void Uaba_V(AILEmitterCtx Context)
  889. {
  890. EmitVectorTernaryOpZx(Context, () =>
  891. {
  892. Context.Emit(OpCodes.Sub);
  893. EmitAbs(Context);
  894. Context.Emit(OpCodes.Add);
  895. });
  896. }
  897. public static void Uabal_V(AILEmitterCtx Context)
  898. {
  899. EmitVectorWidenRnRmTernaryOpZx(Context, () =>
  900. {
  901. Context.Emit(OpCodes.Sub);
  902. EmitAbs(Context);
  903. Context.Emit(OpCodes.Add);
  904. });
  905. }
  906. public static void Uabd_V(AILEmitterCtx Context)
  907. {
  908. EmitVectorBinaryOpZx(Context, () =>
  909. {
  910. Context.Emit(OpCodes.Sub);
  911. EmitAbs(Context);
  912. });
  913. }
  914. public static void Uabdl_V(AILEmitterCtx Context)
  915. {
  916. EmitVectorWidenRnRmBinaryOpZx(Context, () =>
  917. {
  918. Context.Emit(OpCodes.Sub);
  919. EmitAbs(Context);
  920. });
  921. }
  922. public static void Uaddl_V(AILEmitterCtx Context)
  923. {
  924. EmitVectorWidenRnRmBinaryOpZx(Context, () => Context.Emit(OpCodes.Add));
  925. }
  926. public static void Uaddlv_V(AILEmitterCtx Context)
  927. {
  928. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  929. int Bytes = Op.GetBitsCount() >> 3;
  930. int Elems = Bytes >> Op.Size;
  931. EmitVectorExtractZx(Context, Op.Rn, 0, Op.Size);
  932. for (int Index = 1; Index < Elems; Index++)
  933. {
  934. EmitVectorExtractZx(Context, Op.Rn, Index, Op.Size);
  935. Context.Emit(OpCodes.Add);
  936. }
  937. EmitScalarSet(Context, Op.Rd, Op.Size + 1);
  938. }
  939. public static void Uaddw_V(AILEmitterCtx Context)
  940. {
  941. EmitVectorWidenRmBinaryOpZx(Context, () => Context.Emit(OpCodes.Add));
  942. }
  943. public static void Uhadd_V(AILEmitterCtx Context)
  944. {
  945. EmitVectorBinaryOpZx(Context, () =>
  946. {
  947. Context.Emit(OpCodes.Add);
  948. Context.EmitLdc_I4(1);
  949. Context.Emit(OpCodes.Shr_Un);
  950. });
  951. }
  952. public static void Umin_V(AILEmitterCtx Context)
  953. {
  954. Type[] Types = new Type[] { typeof(ulong), typeof(ulong) };
  955. MethodInfo MthdInfo = typeof(Math).GetMethod(nameof(Math.Min), Types);
  956. EmitVectorBinaryOpZx(Context, () => Context.EmitCall(MthdInfo));
  957. }
  958. public static void Uminp_V(AILEmitterCtx Context)
  959. {
  960. Type[] Types = new Type[] { typeof(ulong), typeof(ulong) };
  961. MethodInfo MthdInfo = typeof(Math).GetMethod(nameof(Math.Min), Types);
  962. EmitVectorPairwiseOpZx(Context, () => Context.EmitCall(MthdInfo));
  963. }
  964. public static void Umax_V(AILEmitterCtx Context)
  965. {
  966. Type[] Types = new Type[] { typeof(ulong), typeof(ulong) };
  967. MethodInfo MthdInfo = typeof(Math).GetMethod(nameof(Math.Max), Types);
  968. EmitVectorBinaryOpZx(Context, () => Context.EmitCall(MthdInfo));
  969. }
  970. public static void Umaxp_V(AILEmitterCtx Context)
  971. {
  972. Type[] Types = new Type[] { typeof(ulong), typeof(ulong) };
  973. MethodInfo MthdInfo = typeof(Math).GetMethod(nameof(Math.Max), Types);
  974. EmitVectorPairwiseOpZx(Context, () => Context.EmitCall(MthdInfo));
  975. }
  976. public static void Umull_V(AILEmitterCtx Context)
  977. {
  978. EmitVectorWidenRnRmBinaryOpZx(Context, () => Context.Emit(OpCodes.Mul));
  979. }
  980. public static void Uqxtn_S(AILEmitterCtx Context)
  981. {
  982. EmitScalarSaturatingNarrowOpZxZx(Context, () => { });
  983. }
  984. public static void Uqxtn_V(AILEmitterCtx Context)
  985. {
  986. EmitVectorSaturatingNarrowOpZxZx(Context, () => { });
  987. }
  988. public static void Usubw_V(AILEmitterCtx Context)
  989. {
  990. EmitVectorWidenRmBinaryOpZx(Context, () => Context.Emit(OpCodes.Sub));
  991. }
  992. }
  993. }