AInstEmitSimdArithmetic.cs 35 KB

1234567891011121314151617181920212223242526272829303132333435363738394041424344454647484950515253545556575859606162636465666768697071727374757677787980818283848586878889909192939495969798991001011021031041051061071081091101111121131141151161171181191201211221231241251261271281291301311321331341351361371381391401411421431441451461471481491501511521531541551561571581591601611621631641651661671681691701711721731741751761771781791801811821831841851861871881891901911921931941951961971981992002012022032042052062072082092102112122132142152162172182192202212222232242252262272282292302312322332342352362372382392402412422432442452462472482492502512522532542552562572582592602612622632642652662672682692702712722732742752762772782792802812822832842852862872882892902912922932942952962972982993003013023033043053063073083093103113123133143153163173183193203213223233243253263273283293303313323333343353363373383393403413423433443453463473483493503513523533543553563573583593603613623633643653663673683693703713723733743753763773783793803813823833843853863873883893903913923933943953963973983994004014024034044054064074084094104114124134144154164174184194204214224234244254264274284294304314324334344354364374384394404414424434444454464474484494504514524534544554564574584594604614624634644654664674684694704714724734744754764774784794804814824834844854864874884894904914924934944954964974984995005015025035045055065075085095105115125135145155165175185195205215225235245255265275285295305315325335345355365375385395405415425435445455465475485495505515525535545555565575585595605615625635645655665675685695705715725735745755765775785795805815825835845855865875885895905915925935945955965975985996006016026036046056066076086096106116126136146156166176186196206216226236246256266276286296306316326336346356366376386396406416426436446456466476486496506516526536546556566576586596606616626636646656666676686696706716726736746756766776786796806816826836846856866876886896906916926936946956966976986997007017027037047057067077087097107117127137147157167177187197207217227237247257267277287297307317327337347357367377387397407417427437447457467477487497507517527537547557567577587597607617627637647657667677687697707717727737747757767777787797807817827837847857867877887897907917927937947957967977987998008018028038048058068078088098108118128138148158168178188198208218228238248258268278288298308318328338348358368378388398408418428438448458468478488498508518528538548558568578588598608618628638648658668678688698708718728738748758768778788798808818828838848858868878888898908918928938948958968978988999009019029039049059069079089099109119129139149159169179189199209219229239249259269279289299309319329339349359369379389399409419429439449459469479489499509519529539549559569579589599609619629639649659669679689699709719729739749759769779789799809819829839849859869879889899909919929939949959969979989991000100110021003100410051006100710081009101010111012101310141015101610171018101910201021102210231024102510261027102810291030103110321033103410351036103710381039104010411042104310441045104610471048104910501051105210531054105510561057105810591060106110621063106410651066106710681069107010711072107310741075107610771078107910801081108210831084108510861087108810891090109110921093109410951096109710981099110011011102110311041105110611071108110911101111111211131114111511161117111811191120112111221123112411251126112711281129113011311132113311341135113611371138113911401141114211431144114511461147114811491150115111521153115411551156115711581159116011611162116311641165116611671168116911701171117211731174117511761177117811791180118111821183118411851186118711881189119011911192119311941195119611971198119912001201120212031204120512061207120812091210121112121213121412151216121712181219122012211222
  1. using ChocolArm64.Decoder;
  2. using ChocolArm64.State;
  3. using ChocolArm64.Translation;
  4. using System;
  5. using System.Reflection;
  6. using System.Reflection.Emit;
  7. using System.Runtime.Intrinsics.X86;
  8. using static ChocolArm64.Instruction.AInstEmitSimdHelper;
  9. namespace ChocolArm64.Instruction
  10. {
  11. static partial class AInstEmit
  12. {
  13. public static void Abs_S(AILEmitterCtx Context)
  14. {
  15. EmitScalarUnaryOpSx(Context, () => EmitAbs(Context));
  16. }
  17. public static void Abs_V(AILEmitterCtx Context)
  18. {
  19. EmitVectorUnaryOpSx(Context, () => EmitAbs(Context));
  20. }
  21. private static void EmitAbs(AILEmitterCtx Context)
  22. {
  23. AILLabel LblTrue = new AILLabel();
  24. Context.Emit(OpCodes.Dup);
  25. Context.Emit(OpCodes.Ldc_I4_0);
  26. Context.Emit(OpCodes.Bge_S, LblTrue);
  27. Context.Emit(OpCodes.Neg);
  28. Context.MarkLabel(LblTrue);
  29. }
  30. public static void Add_S(AILEmitterCtx Context)
  31. {
  32. EmitScalarBinaryOpZx(Context, () => Context.Emit(OpCodes.Add));
  33. }
  34. public static void Add_V(AILEmitterCtx Context)
  35. {
  36. if (AOptimizations.UseSse2)
  37. {
  38. EmitSse2Call(Context, nameof(Sse2.Add));
  39. }
  40. else
  41. {
  42. EmitVectorBinaryOpZx(Context, () => Context.Emit(OpCodes.Add));
  43. }
  44. }
  45. public static void Addhn_V(AILEmitterCtx Context)
  46. {
  47. EmitHighNarrow(Context, () => Context.Emit(OpCodes.Add), Round: false);
  48. }
  49. public static void Addp_S(AILEmitterCtx Context)
  50. {
  51. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  52. EmitVectorExtractZx(Context, Op.Rn, 0, Op.Size);
  53. EmitVectorExtractZx(Context, Op.Rn, 1, Op.Size);
  54. Context.Emit(OpCodes.Add);
  55. EmitScalarSet(Context, Op.Rd, Op.Size);
  56. }
  57. public static void Addp_V(AILEmitterCtx Context)
  58. {
  59. AOpCodeSimdReg Op = (AOpCodeSimdReg)Context.CurrOp;
  60. int Bytes = Context.CurrOp.GetBitsCount() >> 3;
  61. int Elems = Bytes >> Op.Size;
  62. int Half = Elems >> 1;
  63. for (int Index = 0; Index < Elems; Index++)
  64. {
  65. int Elem = (Index & (Half - 1)) << 1;
  66. EmitVectorExtractZx(Context, Index < Half ? Op.Rn : Op.Rm, Elem + 0, Op.Size);
  67. EmitVectorExtractZx(Context, Index < Half ? Op.Rn : Op.Rm, Elem + 1, Op.Size);
  68. Context.Emit(OpCodes.Add);
  69. EmitVectorInsertTmp(Context, Index, Op.Size);
  70. }
  71. Context.EmitLdvectmp();
  72. Context.EmitStvec(Op.Rd);
  73. if (Op.RegisterSize == ARegisterSize.SIMD64)
  74. {
  75. EmitVectorZeroUpper(Context, Op.Rd);
  76. }
  77. }
  78. public static void Addv_V(AILEmitterCtx Context)
  79. {
  80. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  81. int Bytes = Context.CurrOp.GetBitsCount() >> 3;
  82. EmitVectorExtractZx(Context, Op.Rn, 0, Op.Size);
  83. for (int Index = 1; Index < (Bytes >> Op.Size); Index++)
  84. {
  85. EmitVectorExtractZx(Context, Op.Rn, Index, Op.Size);
  86. Context.Emit(OpCodes.Add);
  87. }
  88. EmitScalarSet(Context, Op.Rd, Op.Size);
  89. }
  90. public static void Cls_V(AILEmitterCtx Context)
  91. {
  92. MethodInfo MthdInfo = typeof(ASoftFallback).GetMethod(nameof(ASoftFallback.CountLeadingSigns));
  93. EmitCountLeadingBits(Context, () => Context.EmitCall(MthdInfo));
  94. }
  95. public static void Clz_V(AILEmitterCtx Context)
  96. {
  97. MethodInfo MthdInfo = typeof(ASoftFallback).GetMethod(nameof(ASoftFallback.CountLeadingZeros));
  98. EmitCountLeadingBits(Context, () => Context.EmitCall(MthdInfo));
  99. }
  100. private static void EmitCountLeadingBits(AILEmitterCtx Context, Action Emit)
  101. {
  102. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  103. int Bytes = Context.CurrOp.GetBitsCount() >> 3;
  104. for (int Index = 0; Index < (Bytes >> Op.Size); Index++)
  105. {
  106. EmitVectorExtractZx(Context, Op.Rn, Index, Op.Size);
  107. Context.EmitLdc_I4(8 << Op.Size);
  108. Emit();
  109. EmitVectorInsert(Context, Op.Rd, Index, Op.Size);
  110. }
  111. if (Op.RegisterSize == ARegisterSize.SIMD64)
  112. {
  113. EmitVectorZeroUpper(Context, Op.Rd);
  114. }
  115. }
  116. public static void Cnt_V(AILEmitterCtx Context)
  117. {
  118. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  119. int Elems = Op.RegisterSize == ARegisterSize.SIMD128 ? 16 : 8;
  120. for (int Index = 0; Index < Elems; Index++)
  121. {
  122. EmitVectorExtractZx(Context, Op.Rn, Index, 0);
  123. Context.Emit(OpCodes.Conv_U1);
  124. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.CountSetBits8));
  125. Context.Emit(OpCodes.Conv_U8);
  126. EmitVectorInsert(Context, Op.Rd, Index, 0);
  127. }
  128. if (Op.RegisterSize == ARegisterSize.SIMD64)
  129. {
  130. EmitVectorZeroUpper(Context, Op.Rd);
  131. }
  132. }
  133. private static void EmitHighNarrow(AILEmitterCtx Context, Action Emit, bool Round)
  134. {
  135. AOpCodeSimdReg Op = (AOpCodeSimdReg)Context.CurrOp;
  136. int Elems = 8 >> Op.Size;
  137. int ESize = 8 << Op.Size;
  138. int Part = Op.RegisterSize == ARegisterSize.SIMD128 ? Elems : 0;
  139. for (int Index = 0; Index < Elems; Index++)
  140. {
  141. EmitVectorExtractZx(Context, Op.Rn, Index, Op.Size + 1);
  142. EmitVectorExtractZx(Context, Op.Rm, Index, Op.Size + 1);
  143. Emit();
  144. if (Round)
  145. {
  146. Context.EmitLdc_I8(1L << (ESize - 1));
  147. Context.Emit(OpCodes.Add);
  148. }
  149. Context.EmitLsr(ESize);
  150. EmitVectorInsert(Context, Op.Rd, Part + Index, Op.Size);
  151. }
  152. if (Part == 0)
  153. {
  154. EmitVectorZeroUpper(Context, Op.Rd);
  155. }
  156. }
  157. private static void EmitQxtn(AILEmitterCtx Context, bool Signed, bool Scalar)
  158. {
  159. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  160. int Elems = (!Scalar ? 8 >> Op.Size : 1);
  161. int ESize = 8 << Op.Size;
  162. int TMaxValue = (Signed ? (1 << (ESize - 1)) - 1 : (int)((1L << ESize) - 1L));
  163. int TMinValue = (Signed ? -((1 << (ESize - 1))) : 0);
  164. int Part = (!Scalar & (Op.RegisterSize == ARegisterSize.SIMD128) ? Elems : 0);
  165. Context.EmitLdc_I8(0L);
  166. Context.EmitSttmp();
  167. for (int Index = 0; Index < Elems; Index++)
  168. {
  169. AILLabel LblLe = new AILLabel();
  170. AILLabel LblGeEnd = new AILLabel();
  171. EmitVectorExtract(Context, Op.Rn, Index, Op.Size + 1, Signed);
  172. Context.Emit(OpCodes.Dup);
  173. Context.EmitLdc_I4(TMaxValue);
  174. Context.Emit(OpCodes.Conv_U8);
  175. Context.Emit(Signed ? OpCodes.Ble_S : OpCodes.Ble_Un_S, LblLe);
  176. Context.Emit(OpCodes.Pop);
  177. Context.EmitLdc_I4(TMaxValue);
  178. Context.EmitLdc_I8(0x8000000L);
  179. Context.EmitSttmp();
  180. Context.Emit(OpCodes.Br_S, LblGeEnd);
  181. Context.MarkLabel(LblLe);
  182. Context.Emit(OpCodes.Dup);
  183. Context.EmitLdc_I4(TMinValue);
  184. Context.Emit(OpCodes.Conv_I8);
  185. Context.Emit(Signed ? OpCodes.Bge_S : OpCodes.Bge_Un_S, LblGeEnd);
  186. Context.Emit(OpCodes.Pop);
  187. Context.EmitLdc_I4(TMinValue);
  188. Context.EmitLdc_I8(0x8000000L);
  189. Context.EmitSttmp();
  190. Context.MarkLabel(LblGeEnd);
  191. if (Scalar)
  192. {
  193. EmitVectorZeroLower(Context, Op.Rd);
  194. }
  195. EmitVectorInsert(Context, Op.Rd, Part + Index, Op.Size);
  196. }
  197. if (Part == 0)
  198. {
  199. EmitVectorZeroUpper(Context, Op.Rd);
  200. }
  201. Context.EmitLdarg(ATranslatedSub.StateArgIdx);
  202. Context.EmitLdarg(ATranslatedSub.StateArgIdx);
  203. Context.EmitCallPropGet(typeof(AThreadState), nameof(AThreadState.Fpsr));
  204. Context.EmitLdtmp();
  205. Context.Emit(OpCodes.Conv_I4);
  206. Context.Emit(OpCodes.Or);
  207. Context.EmitCallPropSet(typeof(AThreadState), nameof(AThreadState.Fpsr));
  208. }
  209. public static void Fabd_S(AILEmitterCtx Context)
  210. {
  211. EmitScalarBinaryOpF(Context, () =>
  212. {
  213. Context.Emit(OpCodes.Sub);
  214. EmitUnaryMathCall(Context, nameof(Math.Abs));
  215. });
  216. }
  217. public static void Fabs_S(AILEmitterCtx Context)
  218. {
  219. EmitScalarUnaryOpF(Context, () =>
  220. {
  221. EmitUnaryMathCall(Context, nameof(Math.Abs));
  222. });
  223. }
  224. public static void Fadd_S(AILEmitterCtx Context)
  225. {
  226. if (AOptimizations.UseSse2)
  227. {
  228. EmitSse2CallF(Context, nameof(Sse2.AddScalar));
  229. }
  230. else
  231. {
  232. EmitScalarBinaryOpF(Context, () => Context.Emit(OpCodes.Add));
  233. }
  234. }
  235. public static void Fadd_V(AILEmitterCtx Context)
  236. {
  237. if (AOptimizations.UseSse2)
  238. {
  239. EmitSse2CallF(Context, nameof(Sse2.Add));
  240. }
  241. else
  242. {
  243. EmitVectorBinaryOpF(Context, () => Context.Emit(OpCodes.Add));
  244. }
  245. }
  246. public static void Faddp_V(AILEmitterCtx Context)
  247. {
  248. AOpCodeSimdReg Op = (AOpCodeSimdReg)Context.CurrOp;
  249. int SizeF = Op.Size & 1;
  250. int Bytes = Context.CurrOp.GetBitsCount() >> 3;
  251. int Elems = Bytes >> SizeF + 2;
  252. int Half = Elems >> 1;
  253. for (int Index = 0; Index < Elems; Index++)
  254. {
  255. int Elem = (Index & (Half - 1)) << 1;
  256. EmitVectorExtractF(Context, Index < Half ? Op.Rn : Op.Rm, Elem + 0, SizeF);
  257. EmitVectorExtractF(Context, Index < Half ? Op.Rn : Op.Rm, Elem + 1, SizeF);
  258. Context.Emit(OpCodes.Add);
  259. EmitVectorInsertTmpF(Context, Index, SizeF);
  260. }
  261. Context.EmitLdvectmp();
  262. Context.EmitStvec(Op.Rd);
  263. if (Op.RegisterSize == ARegisterSize.SIMD64)
  264. {
  265. EmitVectorZeroUpper(Context, Op.Rd);
  266. }
  267. }
  268. public static void Fdiv_S(AILEmitterCtx Context)
  269. {
  270. if (AOptimizations.UseSse2)
  271. {
  272. EmitSse2CallF(Context, nameof(Sse2.DivideScalar));
  273. }
  274. else
  275. {
  276. EmitScalarBinaryOpF(Context, () => Context.Emit(OpCodes.Div));
  277. }
  278. }
  279. public static void Fdiv_V(AILEmitterCtx Context)
  280. {
  281. if (AOptimizations.UseSse2)
  282. {
  283. EmitSse2CallF(Context, nameof(Sse2.Divide));
  284. }
  285. else
  286. {
  287. EmitVectorBinaryOpF(Context, () => Context.Emit(OpCodes.Div));
  288. }
  289. }
  290. public static void Fmadd_S(AILEmitterCtx Context)
  291. {
  292. EmitScalarTernaryRaOpF(Context, () =>
  293. {
  294. Context.Emit(OpCodes.Mul);
  295. Context.Emit(OpCodes.Add);
  296. });
  297. }
  298. public static void Fmax_S(AILEmitterCtx Context)
  299. {
  300. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  301. EmitScalarBinaryOpF(Context, () =>
  302. {
  303. if (Op.Size == 0)
  304. {
  305. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.MaxF));
  306. }
  307. else if (Op.Size == 1)
  308. {
  309. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.Max));
  310. }
  311. else
  312. {
  313. throw new InvalidOperationException();
  314. }
  315. });
  316. }
  317. public static void Fmax_V(AILEmitterCtx Context)
  318. {
  319. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  320. EmitVectorBinaryOpF(Context, () =>
  321. {
  322. if (Op.Size == 0)
  323. {
  324. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.MaxF));
  325. }
  326. else if (Op.Size == 1)
  327. {
  328. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.Max));
  329. }
  330. else
  331. {
  332. throw new InvalidOperationException();
  333. }
  334. });
  335. }
  336. public static void Fmin_S(AILEmitterCtx Context)
  337. {
  338. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  339. EmitScalarBinaryOpF(Context, () =>
  340. {
  341. if (Op.Size == 0)
  342. {
  343. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.MinF));
  344. }
  345. else if (Op.Size == 1)
  346. {
  347. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.Min));
  348. }
  349. else
  350. {
  351. throw new InvalidOperationException();
  352. }
  353. });
  354. }
  355. public static void Fmin_V(AILEmitterCtx Context)
  356. {
  357. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  358. int SizeF = Op.Size & 1;
  359. EmitVectorBinaryOpF(Context, () =>
  360. {
  361. if (SizeF == 0)
  362. {
  363. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.MinF));
  364. }
  365. else if (SizeF == 1)
  366. {
  367. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.Min));
  368. }
  369. else
  370. {
  371. throw new InvalidOperationException();
  372. }
  373. });
  374. }
  375. public static void Fmaxnm_S(AILEmitterCtx Context)
  376. {
  377. Fmax_S(Context);
  378. }
  379. public static void Fminnm_S(AILEmitterCtx Context)
  380. {
  381. Fmin_S(Context);
  382. }
  383. public static void Fmla_V(AILEmitterCtx Context)
  384. {
  385. EmitVectorTernaryOpF(Context, () =>
  386. {
  387. Context.Emit(OpCodes.Mul);
  388. Context.Emit(OpCodes.Add);
  389. });
  390. }
  391. public static void Fmla_Ve(AILEmitterCtx Context)
  392. {
  393. EmitVectorTernaryOpByElemF(Context, () =>
  394. {
  395. Context.Emit(OpCodes.Mul);
  396. Context.Emit(OpCodes.Add);
  397. });
  398. }
  399. public static void Fmls_V(AILEmitterCtx Context)
  400. {
  401. EmitVectorTernaryOpF(Context, () =>
  402. {
  403. Context.Emit(OpCodes.Mul);
  404. Context.Emit(OpCodes.Sub);
  405. });
  406. }
  407. public static void Fmls_Ve(AILEmitterCtx Context)
  408. {
  409. EmitVectorTernaryOpByElemF(Context, () =>
  410. {
  411. Context.Emit(OpCodes.Mul);
  412. Context.Emit(OpCodes.Sub);
  413. });
  414. }
  415. public static void Fmsub_S(AILEmitterCtx Context)
  416. {
  417. EmitScalarTernaryRaOpF(Context, () =>
  418. {
  419. Context.Emit(OpCodes.Mul);
  420. Context.Emit(OpCodes.Sub);
  421. });
  422. }
  423. public static void Fmul_S(AILEmitterCtx Context)
  424. {
  425. if (AOptimizations.UseSse2)
  426. {
  427. EmitSse2CallF(Context, nameof(Sse2.MultiplyScalar));
  428. }
  429. else
  430. {
  431. EmitScalarBinaryOpF(Context, () => Context.Emit(OpCodes.Mul));
  432. }
  433. }
  434. public static void Fmul_Se(AILEmitterCtx Context)
  435. {
  436. EmitScalarBinaryOpByElemF(Context, () => Context.Emit(OpCodes.Mul));
  437. }
  438. public static void Fmul_V(AILEmitterCtx Context)
  439. {
  440. if (AOptimizations.UseSse2)
  441. {
  442. EmitSse2CallF(Context, nameof(Sse2.Multiply));
  443. }
  444. else
  445. {
  446. EmitVectorBinaryOpF(Context, () => Context.Emit(OpCodes.Mul));
  447. }
  448. }
  449. public static void Fmul_Ve(AILEmitterCtx Context)
  450. {
  451. EmitVectorBinaryOpByElemF(Context, () => Context.Emit(OpCodes.Mul));
  452. }
  453. public static void Fneg_S(AILEmitterCtx Context)
  454. {
  455. EmitScalarUnaryOpF(Context, () => Context.Emit(OpCodes.Neg));
  456. }
  457. public static void Fneg_V(AILEmitterCtx Context)
  458. {
  459. EmitVectorUnaryOpF(Context, () => Context.Emit(OpCodes.Neg));
  460. }
  461. public static void Fnmadd_S(AILEmitterCtx Context)
  462. {
  463. AOpCodeSimdReg Op = (AOpCodeSimdReg)Context.CurrOp;
  464. int SizeF = Op.Size & 1;
  465. EmitVectorExtractF(Context, Op.Rn, 0, SizeF);
  466. Context.Emit(OpCodes.Neg);
  467. EmitVectorExtractF(Context, Op.Rm, 0, SizeF);
  468. Context.Emit(OpCodes.Mul);
  469. EmitVectorExtractF(Context, Op.Ra, 0, SizeF);
  470. Context.Emit(OpCodes.Sub);
  471. EmitScalarSetF(Context, Op.Rd, SizeF);
  472. }
  473. public static void Fnmsub_S(AILEmitterCtx Context)
  474. {
  475. AOpCodeSimdReg Op = (AOpCodeSimdReg)Context.CurrOp;
  476. int SizeF = Op.Size & 1;
  477. EmitVectorExtractF(Context, Op.Rn, 0, SizeF);
  478. EmitVectorExtractF(Context, Op.Rm, 0, SizeF);
  479. Context.Emit(OpCodes.Mul);
  480. EmitVectorExtractF(Context, Op.Ra, 0, SizeF);
  481. Context.Emit(OpCodes.Sub);
  482. EmitScalarSetF(Context, Op.Rd, SizeF);
  483. }
  484. public static void Fnmul_S(AILEmitterCtx Context)
  485. {
  486. EmitScalarBinaryOpF(Context, () =>
  487. {
  488. Context.Emit(OpCodes.Mul);
  489. Context.Emit(OpCodes.Neg);
  490. });
  491. }
  492. public static void Frecpe_S(AILEmitterCtx Context)
  493. {
  494. EmitFrecpe(Context, 0, Scalar: true);
  495. }
  496. public static void Frecpe_V(AILEmitterCtx Context)
  497. {
  498. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  499. int SizeF = Op.Size & 1;
  500. int Bytes = Context.CurrOp.GetBitsCount() >> 3;
  501. for (int Index = 0; Index < Bytes >> SizeF + 2; Index++)
  502. {
  503. EmitFrecpe(Context, Index, Scalar: false);
  504. }
  505. if (Op.RegisterSize == ARegisterSize.SIMD64)
  506. {
  507. EmitVectorZeroUpper(Context, Op.Rd);
  508. }
  509. }
  510. private static void EmitFrecpe(AILEmitterCtx Context, int Index, bool Scalar)
  511. {
  512. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  513. int SizeF = Op.Size & 1;
  514. if (SizeF == 0)
  515. {
  516. Context.EmitLdc_R4(1);
  517. }
  518. else /* if (SizeF == 1) */
  519. {
  520. Context.EmitLdc_R8(1);
  521. }
  522. EmitVectorExtractF(Context, Op.Rn, Index, SizeF);
  523. Context.Emit(OpCodes.Div);
  524. if (Scalar)
  525. {
  526. EmitVectorZeroAll(Context, Op.Rd);
  527. }
  528. EmitVectorInsertF(Context, Op.Rd, Index, SizeF);
  529. }
  530. public static void Frecps_S(AILEmitterCtx Context)
  531. {
  532. EmitFrecps(Context, 0, Scalar: true);
  533. }
  534. public static void Frecps_V(AILEmitterCtx Context)
  535. {
  536. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  537. int SizeF = Op.Size & 1;
  538. int Bytes = Context.CurrOp.GetBitsCount() >> 3;
  539. for (int Index = 0; Index < Bytes >> SizeF + 2; Index++)
  540. {
  541. EmitFrecps(Context, Index, Scalar: false);
  542. }
  543. if (Op.RegisterSize == ARegisterSize.SIMD64)
  544. {
  545. EmitVectorZeroUpper(Context, Op.Rd);
  546. }
  547. }
  548. private static void EmitFrecps(AILEmitterCtx Context, int Index, bool Scalar)
  549. {
  550. AOpCodeSimdReg Op = (AOpCodeSimdReg)Context.CurrOp;
  551. int SizeF = Op.Size & 1;
  552. if (SizeF == 0)
  553. {
  554. Context.EmitLdc_R4(2);
  555. }
  556. else /* if (SizeF == 1) */
  557. {
  558. Context.EmitLdc_R8(2);
  559. }
  560. EmitVectorExtractF(Context, Op.Rn, Index, SizeF);
  561. EmitVectorExtractF(Context, Op.Rm, Index, SizeF);
  562. Context.Emit(OpCodes.Mul);
  563. Context.Emit(OpCodes.Sub);
  564. if (Scalar)
  565. {
  566. EmitVectorZeroAll(Context, Op.Rd);
  567. }
  568. EmitVectorInsertF(Context, Op.Rd, Index, SizeF);
  569. }
  570. public static void Frinta_S(AILEmitterCtx Context)
  571. {
  572. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  573. EmitVectorExtractF(Context, Op.Rn, 0, Op.Size);
  574. EmitRoundMathCall(Context, MidpointRounding.AwayFromZero);
  575. EmitScalarSetF(Context, Op.Rd, Op.Size);
  576. }
  577. public static void Frinta_V(AILEmitterCtx Context)
  578. {
  579. EmitVectorUnaryOpF(Context, () =>
  580. {
  581. EmitRoundMathCall(Context, MidpointRounding.AwayFromZero);
  582. });
  583. }
  584. public static void Frinti_S(AILEmitterCtx Context)
  585. {
  586. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  587. EmitScalarUnaryOpF(Context, () =>
  588. {
  589. Context.EmitLdarg(ATranslatedSub.StateArgIdx);
  590. Context.EmitCallPropGet(typeof(AThreadState), nameof(AThreadState.Fpcr));
  591. if (Op.Size == 0)
  592. {
  593. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.RoundF));
  594. }
  595. else if (Op.Size == 1)
  596. {
  597. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.Round));
  598. }
  599. else
  600. {
  601. throw new InvalidOperationException();
  602. }
  603. });
  604. }
  605. public static void Frinti_V(AILEmitterCtx Context)
  606. {
  607. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  608. int SizeF = Op.Size & 1;
  609. EmitVectorUnaryOpF(Context, () =>
  610. {
  611. Context.EmitLdarg(ATranslatedSub.StateArgIdx);
  612. Context.EmitCallPropGet(typeof(AThreadState), nameof(AThreadState.Fpcr));
  613. if (SizeF == 0)
  614. {
  615. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.RoundF));
  616. }
  617. else if (SizeF == 1)
  618. {
  619. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.Round));
  620. }
  621. else
  622. {
  623. throw new InvalidOperationException();
  624. }
  625. });
  626. }
  627. public static void Frintm_S(AILEmitterCtx Context)
  628. {
  629. EmitScalarUnaryOpF(Context, () =>
  630. {
  631. EmitUnaryMathCall(Context, nameof(Math.Floor));
  632. });
  633. }
  634. public static void Frintm_V(AILEmitterCtx Context)
  635. {
  636. EmitVectorUnaryOpF(Context, () =>
  637. {
  638. EmitUnaryMathCall(Context, nameof(Math.Floor));
  639. });
  640. }
  641. public static void Frintn_S(AILEmitterCtx Context)
  642. {
  643. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  644. EmitVectorExtractF(Context, Op.Rn, 0, Op.Size);
  645. EmitRoundMathCall(Context, MidpointRounding.ToEven);
  646. EmitScalarSetF(Context, Op.Rd, Op.Size);
  647. }
  648. public static void Frintn_V(AILEmitterCtx Context)
  649. {
  650. EmitVectorUnaryOpF(Context, () =>
  651. {
  652. EmitRoundMathCall(Context, MidpointRounding.ToEven);
  653. });
  654. }
  655. public static void Frintp_S(AILEmitterCtx Context)
  656. {
  657. EmitScalarUnaryOpF(Context, () =>
  658. {
  659. EmitUnaryMathCall(Context, nameof(Math.Ceiling));
  660. });
  661. }
  662. public static void Frintp_V(AILEmitterCtx Context)
  663. {
  664. EmitVectorUnaryOpF(Context, () =>
  665. {
  666. EmitUnaryMathCall(Context, nameof(Math.Ceiling));
  667. });
  668. }
  669. public static void Frintx_S(AILEmitterCtx Context)
  670. {
  671. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  672. EmitScalarUnaryOpF(Context, () =>
  673. {
  674. Context.EmitLdarg(ATranslatedSub.StateArgIdx);
  675. Context.EmitCallPropGet(typeof(AThreadState), nameof(AThreadState.Fpcr));
  676. if (Op.Size == 0)
  677. {
  678. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.RoundF));
  679. }
  680. else if (Op.Size == 1)
  681. {
  682. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.Round));
  683. }
  684. else
  685. {
  686. throw new InvalidOperationException();
  687. }
  688. });
  689. }
  690. public static void Frintx_V(AILEmitterCtx Context)
  691. {
  692. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  693. EmitVectorUnaryOpF(Context, () =>
  694. {
  695. Context.EmitLdarg(ATranslatedSub.StateArgIdx);
  696. Context.EmitCallPropGet(typeof(AThreadState), nameof(AThreadState.Fpcr));
  697. if (Op.Size == 0)
  698. {
  699. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.RoundF));
  700. }
  701. else if (Op.Size == 1)
  702. {
  703. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.Round));
  704. }
  705. else
  706. {
  707. throw new InvalidOperationException();
  708. }
  709. });
  710. }
  711. public static void Frsqrte_S(AILEmitterCtx Context)
  712. {
  713. EmitScalarUnaryOpF(Context, () =>
  714. {
  715. EmitUnarySoftFloatCall(Context, nameof(ASoftFloat.InvSqrtEstimate));
  716. });
  717. }
  718. public static void Frsqrte_V(AILEmitterCtx Context)
  719. {
  720. EmitVectorUnaryOpF(Context, () =>
  721. {
  722. EmitUnarySoftFloatCall(Context, nameof(ASoftFloat.InvSqrtEstimate));
  723. });
  724. }
  725. public static void Frsqrts_S(AILEmitterCtx Context)
  726. {
  727. EmitFrsqrts(Context, 0, Scalar: true);
  728. }
  729. public static void Frsqrts_V(AILEmitterCtx Context)
  730. {
  731. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  732. int SizeF = Op.Size & 1;
  733. int Bytes = Context.CurrOp.GetBitsCount() >> 3;
  734. for (int Index = 0; Index < Bytes >> SizeF + 2; Index++)
  735. {
  736. EmitFrsqrts(Context, Index, Scalar: false);
  737. }
  738. if (Op.RegisterSize == ARegisterSize.SIMD64)
  739. {
  740. EmitVectorZeroUpper(Context, Op.Rd);
  741. }
  742. }
  743. private static void EmitFrsqrts(AILEmitterCtx Context, int Index, bool Scalar)
  744. {
  745. AOpCodeSimdReg Op = (AOpCodeSimdReg)Context.CurrOp;
  746. int SizeF = Op.Size & 1;
  747. if (SizeF == 0)
  748. {
  749. Context.EmitLdc_R4(3);
  750. }
  751. else /* if (SizeF == 1) */
  752. {
  753. Context.EmitLdc_R8(3);
  754. }
  755. EmitVectorExtractF(Context, Op.Rn, Index, SizeF);
  756. EmitVectorExtractF(Context, Op.Rm, Index, SizeF);
  757. Context.Emit(OpCodes.Mul);
  758. Context.Emit(OpCodes.Sub);
  759. if (SizeF == 0)
  760. {
  761. Context.EmitLdc_R4(0.5f);
  762. }
  763. else /* if (SizeF == 1) */
  764. {
  765. Context.EmitLdc_R8(0.5);
  766. }
  767. Context.Emit(OpCodes.Mul);
  768. if (Scalar)
  769. {
  770. EmitVectorZeroAll(Context, Op.Rd);
  771. }
  772. EmitVectorInsertF(Context, Op.Rd, Index, SizeF);
  773. }
  774. public static void Fsqrt_S(AILEmitterCtx Context)
  775. {
  776. EmitScalarUnaryOpF(Context, () =>
  777. {
  778. EmitUnaryMathCall(Context, nameof(Math.Sqrt));
  779. });
  780. }
  781. public static void Fsub_S(AILEmitterCtx Context)
  782. {
  783. if (AOptimizations.UseSse2)
  784. {
  785. EmitSse2CallF(Context, nameof(Sse2.SubtractScalar));
  786. }
  787. else
  788. {
  789. EmitScalarBinaryOpF(Context, () => Context.Emit(OpCodes.Sub));
  790. }
  791. }
  792. public static void Fsub_V(AILEmitterCtx Context)
  793. {
  794. if (AOptimizations.UseSse2)
  795. {
  796. EmitSse2CallF(Context, nameof(Sse2.Subtract));
  797. }
  798. else
  799. {
  800. EmitVectorBinaryOpF(Context, () => Context.Emit(OpCodes.Sub));
  801. }
  802. }
  803. public static void Mla_V(AILEmitterCtx Context)
  804. {
  805. EmitVectorTernaryOpZx(Context, () =>
  806. {
  807. Context.Emit(OpCodes.Mul);
  808. Context.Emit(OpCodes.Add);
  809. });
  810. }
  811. public static void Mla_Ve(AILEmitterCtx Context)
  812. {
  813. EmitVectorTernaryOpByElemZx(Context, () =>
  814. {
  815. Context.Emit(OpCodes.Mul);
  816. Context.Emit(OpCodes.Add);
  817. });
  818. }
  819. public static void Mls_V(AILEmitterCtx Context)
  820. {
  821. EmitVectorTernaryOpZx(Context, () =>
  822. {
  823. Context.Emit(OpCodes.Mul);
  824. Context.Emit(OpCodes.Sub);
  825. });
  826. }
  827. public static void Mul_V(AILEmitterCtx Context)
  828. {
  829. EmitVectorBinaryOpZx(Context, () => Context.Emit(OpCodes.Mul));
  830. }
  831. public static void Mul_Ve(AILEmitterCtx Context)
  832. {
  833. EmitVectorBinaryOpByElemZx(Context, () => Context.Emit(OpCodes.Mul));
  834. }
  835. public static void Neg_S(AILEmitterCtx Context)
  836. {
  837. EmitScalarUnaryOpSx(Context, () => Context.Emit(OpCodes.Neg));
  838. }
  839. public static void Neg_V(AILEmitterCtx Context)
  840. {
  841. EmitVectorUnaryOpSx(Context, () => Context.Emit(OpCodes.Neg));
  842. }
  843. public static void Raddhn_V(AILEmitterCtx Context)
  844. {
  845. EmitHighNarrow(Context, () => Context.Emit(OpCodes.Add), Round: true);
  846. }
  847. public static void Rsubhn_V(AILEmitterCtx Context)
  848. {
  849. EmitHighNarrow(Context, () => Context.Emit(OpCodes.Sub), Round: true);
  850. }
  851. public static void Saddw_V(AILEmitterCtx Context)
  852. {
  853. EmitVectorWidenRmBinaryOpSx(Context, () => Context.Emit(OpCodes.Add));
  854. }
  855. public static void Smax_V(AILEmitterCtx Context)
  856. {
  857. Type[] Types = new Type[] { typeof(long), typeof(long) };
  858. MethodInfo MthdInfo = typeof(Math).GetMethod(nameof(Math.Max), Types);
  859. EmitVectorBinaryOpSx(Context, () => Context.EmitCall(MthdInfo));
  860. }
  861. public static void Smin_V(AILEmitterCtx Context)
  862. {
  863. Type[] Types = new Type[] { typeof(long), typeof(long) };
  864. MethodInfo MthdInfo = typeof(Math).GetMethod(nameof(Math.Min), Types);
  865. EmitVectorBinaryOpSx(Context, () => Context.EmitCall(MthdInfo));
  866. }
  867. public static void Smlal_V(AILEmitterCtx Context)
  868. {
  869. EmitVectorWidenRnRmTernaryOpSx(Context, () =>
  870. {
  871. Context.Emit(OpCodes.Mul);
  872. Context.Emit(OpCodes.Add);
  873. });
  874. }
  875. public static void Smull_V(AILEmitterCtx Context)
  876. {
  877. EmitVectorWidenRnRmBinaryOpSx(Context, () => Context.Emit(OpCodes.Mul));
  878. }
  879. public static void Sqxtn_S(AILEmitterCtx Context)
  880. {
  881. EmitQxtn(Context, Signed: true, Scalar: true);
  882. }
  883. public static void Sqxtn_V(AILEmitterCtx Context)
  884. {
  885. EmitQxtn(Context, Signed: true, Scalar: false);
  886. }
  887. public static void Sub_S(AILEmitterCtx Context)
  888. {
  889. EmitScalarBinaryOpZx(Context, () => Context.Emit(OpCodes.Sub));
  890. }
  891. public static void Sub_V(AILEmitterCtx Context)
  892. {
  893. if (AOptimizations.UseSse2)
  894. {
  895. EmitSse2Call(Context, nameof(Sse2.Subtract));
  896. }
  897. else
  898. {
  899. EmitVectorBinaryOpZx(Context, () => Context.Emit(OpCodes.Sub));
  900. }
  901. }
  902. public static void Subhn_V(AILEmitterCtx Context)
  903. {
  904. EmitHighNarrow(Context, () => Context.Emit(OpCodes.Sub), Round: false);
  905. }
  906. public static void Uabd_V(AILEmitterCtx Context)
  907. {
  908. EmitVectorBinaryOpZx(Context, () => EmitAbd(Context));
  909. }
  910. public static void Uabdl_V(AILEmitterCtx Context)
  911. {
  912. EmitVectorWidenRnRmBinaryOpZx(Context, () => EmitAbd(Context));
  913. }
  914. private static void EmitAbd(AILEmitterCtx Context)
  915. {
  916. Context.Emit(OpCodes.Sub);
  917. Type[] Types = new Type[] { typeof(long) };
  918. Context.EmitCall(typeof(Math).GetMethod(nameof(Math.Abs), Types));
  919. }
  920. public static void Uaddl_V(AILEmitterCtx Context)
  921. {
  922. EmitVectorWidenRnRmBinaryOpZx(Context, () => Context.Emit(OpCodes.Add));
  923. }
  924. public static void Uaddlv_V(AILEmitterCtx Context)
  925. {
  926. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  927. int Bytes = Context.CurrOp.GetBitsCount() >> 3;
  928. EmitVectorExtractZx(Context, Op.Rn, 0, Op.Size);
  929. for (int Index = 1; Index < (Bytes >> Op.Size); Index++)
  930. {
  931. EmitVectorExtractZx(Context, Op.Rn, Index, Op.Size);
  932. Context.Emit(OpCodes.Add);
  933. }
  934. EmitScalarSet(Context, Op.Rd, Op.Size + 1);
  935. }
  936. public static void Uaddw_V(AILEmitterCtx Context)
  937. {
  938. EmitVectorWidenRmBinaryOpZx(Context, () => Context.Emit(OpCodes.Add));
  939. }
  940. public static void Uhadd_V(AILEmitterCtx Context)
  941. {
  942. EmitVectorBinaryOpZx(Context, () =>
  943. {
  944. Context.Emit(OpCodes.Add);
  945. Context.EmitLdc_I4(1);
  946. Context.Emit(OpCodes.Shr_Un);
  947. });
  948. }
  949. public static void Umull_V(AILEmitterCtx Context)
  950. {
  951. EmitVectorWidenRnRmBinaryOpZx(Context, () => Context.Emit(OpCodes.Mul));
  952. }
  953. public static void Uqxtn_S(AILEmitterCtx Context)
  954. {
  955. EmitQxtn(Context, Signed: false, Scalar: true);
  956. }
  957. public static void Uqxtn_V(AILEmitterCtx Context)
  958. {
  959. EmitQxtn(Context, Signed: false, Scalar: false);
  960. }
  961. }
  962. }