AInstEmitSimdArithmetic.cs 35 KB

12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061626364656667686970717273747576777879808182838485868788899091929394959697989910010110210310410510610710810911011111211311411511611711811912012112212312412512612712812913013113213313413513613713813914014114214314414514614714814915015115215315415515615715815916016116216316416516616716816917017117217317417517617717817918018118218318418518618718818919019119219319419519619719819920020120220320420520620720820921021121221321421521621721821922022122222322422522622722822923023123223323423523623723823924024124224324424524624724824925025125225325425525625725825926026126226326426526626726826927027127227327427527627727827928028128228328428528628728828929029129229329429529629729829930030130230330430530630730830931031131231331431531631731831932032132232332432532632732832933033133233333433533633733833934034134234334434534634734834935035135235335435535635735835936036136236336436536636736836937037137237337437537637737837938038138238338438538638738838939039139239339439539639739839940040140240340440540640740840941041141241341441541641741841942042142242342442542642742842943043143243343443543643743843944044144244344444544644744844945045145245345445545645745845946046146246346446546646746846947047147247347447547647747847948048148248348448548648748848949049149249349449549649749849950050150250350450550650750850951051151251351451551651751851952052152252352452552652752852953053153253353453553653753853954054154254354454554654754854955055155255355455555655755855956056156256356456556656756856957057157257357457557657757857958058158258358458558658758858959059159259359459559659759859960060160260360460560660760860961061161261361461561661761861962062162262362462562662762862963063163263363463563663763863964064164264364464564664764864965065165265365465565665765865966066166266366466566666766866967067167267367467567667767867968068168268368468568668768868969069169269369469569669769869970070170270370470570670770870971071171271371471571671771871972072172272372472572672772872973073173273373473573673773873974074174274374474574674774874975075175275375475575675775875976076176276376476576676776876977077177277377477577677777877978078178278378478578678778878979079179279379479579679779879980080180280380480580680780880981081181281381481581681781881982082182282382482582682782882983083183283383483583683783883984084184284384484584684784884985085185285385485585685785885986086186286386486586686786886987087187287387487587687787887988088188288388488588688788888989089189289389489589689789889990090190290390490590690790890991091191291391491591691791891992092192292392492592692792892993093193293393493593693793893994094194294394494594694794894995095195295395495595695795895996096196296396496596696796896997097197297397497597697797897998098198298398498598698798898999099199299399499599699799899910001001100210031004100510061007100810091010101110121013101410151016101710181019102010211022102310241025102610271028102910301031103210331034103510361037103810391040104110421043104410451046104710481049105010511052105310541055105610571058105910601061106210631064106510661067106810691070107110721073107410751076107710781079108010811082108310841085108610871088108910901091109210931094109510961097109810991100110111021103110411051106110711081109111011111112111311141115111611171118111911201121112211231124112511261127112811291130113111321133113411351136113711381139114011411142114311441145114611471148114911501151115211531154115511561157115811591160116111621163116411651166116711681169117011711172117311741175117611771178117911801181118211831184118511861187118811891190119111921193119411951196119711981199120012011202120312041205120612071208120912101211121212131214121512161217121812191220122112221223122412251226122712281229
  1. using ChocolArm64.Decoder;
  2. using ChocolArm64.State;
  3. using ChocolArm64.Translation;
  4. using System;
  5. using System.Reflection;
  6. using System.Reflection.Emit;
  7. using System.Runtime.Intrinsics.X86;
  8. using static ChocolArm64.Instruction.AInstEmitSimdHelper;
  9. namespace ChocolArm64.Instruction
  10. {
  11. static partial class AInstEmit
  12. {
  13. public static void Abs_S(AILEmitterCtx Context)
  14. {
  15. EmitScalarUnaryOpSx(Context, () => EmitAbs(Context));
  16. }
  17. public static void Abs_V(AILEmitterCtx Context)
  18. {
  19. EmitVectorUnaryOpSx(Context, () => EmitAbs(Context));
  20. }
  21. public static void Add_S(AILEmitterCtx Context)
  22. {
  23. EmitScalarBinaryOpZx(Context, () => Context.Emit(OpCodes.Add));
  24. }
  25. public static void Add_V(AILEmitterCtx Context)
  26. {
  27. if (AOptimizations.UseSse2)
  28. {
  29. EmitSse2Call(Context, nameof(Sse2.Add));
  30. }
  31. else
  32. {
  33. EmitVectorBinaryOpZx(Context, () => Context.Emit(OpCodes.Add));
  34. }
  35. }
  36. public static void Addhn_V(AILEmitterCtx Context)
  37. {
  38. EmitHighNarrow(Context, () => Context.Emit(OpCodes.Add), Round: false);
  39. }
  40. public static void Addp_S(AILEmitterCtx Context)
  41. {
  42. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  43. EmitVectorExtractZx(Context, Op.Rn, 0, Op.Size);
  44. EmitVectorExtractZx(Context, Op.Rn, 1, Op.Size);
  45. Context.Emit(OpCodes.Add);
  46. EmitScalarSet(Context, Op.Rd, Op.Size);
  47. }
  48. public static void Addp_V(AILEmitterCtx Context)
  49. {
  50. EmitVectorPairwiseOpZx(Context, () => Context.Emit(OpCodes.Add));
  51. }
  52. public static void Addv_V(AILEmitterCtx Context)
  53. {
  54. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  55. int Bytes = Op.GetBitsCount() >> 3;
  56. int Elems = Bytes >> Op.Size;
  57. EmitVectorExtractZx(Context, Op.Rn, 0, Op.Size);
  58. for (int Index = 1; Index < Elems; Index++)
  59. {
  60. EmitVectorExtractZx(Context, Op.Rn, Index, Op.Size);
  61. Context.Emit(OpCodes.Add);
  62. }
  63. EmitScalarSet(Context, Op.Rd, Op.Size);
  64. }
  65. public static void Cls_V(AILEmitterCtx Context)
  66. {
  67. MethodInfo MthdInfo = typeof(ASoftFallback).GetMethod(nameof(ASoftFallback.CountLeadingSigns));
  68. EmitCountLeadingBits(Context, () => Context.EmitCall(MthdInfo));
  69. }
  70. public static void Clz_V(AILEmitterCtx Context)
  71. {
  72. MethodInfo MthdInfo = typeof(ASoftFallback).GetMethod(nameof(ASoftFallback.CountLeadingZeros));
  73. EmitCountLeadingBits(Context, () => Context.EmitCall(MthdInfo));
  74. }
  75. private static void EmitCountLeadingBits(AILEmitterCtx Context, Action Emit)
  76. {
  77. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  78. int Bytes = Op.GetBitsCount() >> 3;
  79. int Elems = Bytes >> Op.Size;
  80. int ESize = 8 << Op.Size;
  81. for (int Index = 0; Index < Elems; Index++)
  82. {
  83. EmitVectorExtractZx(Context, Op.Rn, Index, Op.Size);
  84. Context.EmitLdc_I4(ESize);
  85. Emit();
  86. EmitVectorInsert(Context, Op.Rd, Index, Op.Size);
  87. }
  88. if (Op.RegisterSize == ARegisterSize.SIMD64)
  89. {
  90. EmitVectorZeroUpper(Context, Op.Rd);
  91. }
  92. }
  93. public static void Cnt_V(AILEmitterCtx Context)
  94. {
  95. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  96. int Elems = Op.RegisterSize == ARegisterSize.SIMD128 ? 16 : 8;
  97. for (int Index = 0; Index < Elems; Index++)
  98. {
  99. EmitVectorExtractZx(Context, Op.Rn, Index, 0);
  100. Context.Emit(OpCodes.Conv_U4);
  101. ASoftFallback.EmitCall(Context, nameof(ASoftFallback.CountSetBits8));
  102. Context.Emit(OpCodes.Conv_U8);
  103. EmitVectorInsert(Context, Op.Rd, Index, 0);
  104. }
  105. if (Op.RegisterSize == ARegisterSize.SIMD64)
  106. {
  107. EmitVectorZeroUpper(Context, Op.Rd);
  108. }
  109. }
  110. private static void EmitAbs(AILEmitterCtx Context)
  111. {
  112. AILLabel LblTrue = new AILLabel();
  113. Context.Emit(OpCodes.Dup);
  114. Context.Emit(OpCodes.Ldc_I4_0);
  115. Context.Emit(OpCodes.Bge_S, LblTrue);
  116. Context.Emit(OpCodes.Neg);
  117. Context.MarkLabel(LblTrue);
  118. }
  119. private static void EmitHighNarrow(AILEmitterCtx Context, Action Emit, bool Round)
  120. {
  121. AOpCodeSimdReg Op = (AOpCodeSimdReg)Context.CurrOp;
  122. int Elems = 8 >> Op.Size;
  123. int ESize = 8 << Op.Size;
  124. int Part = Op.RegisterSize == ARegisterSize.SIMD128 ? Elems : 0;
  125. long RoundConst = 1L << (ESize - 1);
  126. if (Part != 0)
  127. {
  128. Context.EmitLdvec(Op.Rd);
  129. Context.EmitStvectmp();
  130. }
  131. for (int Index = 0; Index < Elems; Index++)
  132. {
  133. EmitVectorExtractZx(Context, Op.Rn, Index, Op.Size + 1);
  134. EmitVectorExtractZx(Context, Op.Rm, Index, Op.Size + 1);
  135. Emit();
  136. if (Round)
  137. {
  138. Context.EmitLdc_I8(RoundConst);
  139. Context.Emit(OpCodes.Add);
  140. }
  141. Context.EmitLsr(ESize);
  142. EmitVectorInsertTmp(Context, Part + Index, Op.Size);
  143. }
  144. Context.EmitLdvectmp();
  145. Context.EmitStvec(Op.Rd);
  146. if (Part == 0)
  147. {
  148. EmitVectorZeroUpper(Context, Op.Rd);
  149. }
  150. }
  151. public static void Fabd_S(AILEmitterCtx Context)
  152. {
  153. EmitScalarBinaryOpF(Context, () =>
  154. {
  155. Context.Emit(OpCodes.Sub);
  156. EmitUnaryMathCall(Context, nameof(Math.Abs));
  157. });
  158. }
  159. public static void Fabs_S(AILEmitterCtx Context)
  160. {
  161. EmitScalarUnaryOpF(Context, () =>
  162. {
  163. EmitUnaryMathCall(Context, nameof(Math.Abs));
  164. });
  165. }
  166. public static void Fabs_V(AILEmitterCtx Context)
  167. {
  168. EmitVectorUnaryOpF(Context, () =>
  169. {
  170. EmitUnaryMathCall(Context, nameof(Math.Abs));
  171. });
  172. }
  173. public static void Fadd_S(AILEmitterCtx Context)
  174. {
  175. if (AOptimizations.UseSse && AOptimizations.UseSse2)
  176. {
  177. EmitSseOrSse2CallF(Context, nameof(Sse.AddScalar));
  178. }
  179. else
  180. {
  181. EmitScalarBinaryOpF(Context, () => Context.Emit(OpCodes.Add));
  182. }
  183. }
  184. public static void Fadd_V(AILEmitterCtx Context)
  185. {
  186. if (AOptimizations.UseSse && AOptimizations.UseSse2)
  187. {
  188. EmitSseOrSse2CallF(Context, nameof(Sse.Add));
  189. }
  190. else
  191. {
  192. EmitVectorBinaryOpF(Context, () => Context.Emit(OpCodes.Add));
  193. }
  194. }
  195. public static void Faddp_S(AILEmitterCtx Context)
  196. {
  197. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  198. int SizeF = Op.Size & 1;
  199. EmitVectorExtractF(Context, Op.Rn, 0, SizeF);
  200. EmitVectorExtractF(Context, Op.Rn, 1, SizeF);
  201. Context.Emit(OpCodes.Add);
  202. EmitScalarSetF(Context, Op.Rd, SizeF);
  203. }
  204. public static void Faddp_V(AILEmitterCtx Context)
  205. {
  206. AOpCodeSimdReg Op = (AOpCodeSimdReg)Context.CurrOp;
  207. int SizeF = Op.Size & 1;
  208. int Bytes = Op.GetBitsCount() >> 3;
  209. int Elems = Bytes >> SizeF + 2;
  210. int Half = Elems >> 1;
  211. for (int Index = 0; Index < Elems; Index++)
  212. {
  213. int Elem = (Index & (Half - 1)) << 1;
  214. EmitVectorExtractF(Context, Index < Half ? Op.Rn : Op.Rm, Elem + 0, SizeF);
  215. EmitVectorExtractF(Context, Index < Half ? Op.Rn : Op.Rm, Elem + 1, SizeF);
  216. Context.Emit(OpCodes.Add);
  217. EmitVectorInsertTmpF(Context, Index, SizeF);
  218. }
  219. Context.EmitLdvectmp();
  220. Context.EmitStvec(Op.Rd);
  221. if (Op.RegisterSize == ARegisterSize.SIMD64)
  222. {
  223. EmitVectorZeroUpper(Context, Op.Rd);
  224. }
  225. }
  226. public static void Fdiv_S(AILEmitterCtx Context)
  227. {
  228. if (AOptimizations.UseSse && AOptimizations.UseSse2)
  229. {
  230. EmitSseOrSse2CallF(Context, nameof(Sse.DivideScalar));
  231. }
  232. else
  233. {
  234. EmitScalarBinaryOpF(Context, () => Context.Emit(OpCodes.Div));
  235. }
  236. }
  237. public static void Fdiv_V(AILEmitterCtx Context)
  238. {
  239. if (AOptimizations.UseSse && AOptimizations.UseSse2)
  240. {
  241. EmitSseOrSse2CallF(Context, nameof(Sse.Divide));
  242. }
  243. else
  244. {
  245. EmitVectorBinaryOpF(Context, () => Context.Emit(OpCodes.Div));
  246. }
  247. }
  248. public static void Fmadd_S(AILEmitterCtx Context)
  249. {
  250. EmitScalarTernaryRaOpF(Context, () =>
  251. {
  252. Context.Emit(OpCodes.Mul);
  253. Context.Emit(OpCodes.Add);
  254. });
  255. }
  256. public static void Fmax_S(AILEmitterCtx Context)
  257. {
  258. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  259. EmitScalarBinaryOpF(Context, () =>
  260. {
  261. if (Op.Size == 0)
  262. {
  263. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.MaxF));
  264. }
  265. else if (Op.Size == 1)
  266. {
  267. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.Max));
  268. }
  269. else
  270. {
  271. throw new InvalidOperationException();
  272. }
  273. });
  274. }
  275. public static void Fmax_V(AILEmitterCtx Context)
  276. {
  277. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  278. EmitVectorBinaryOpF(Context, () =>
  279. {
  280. if (Op.Size == 0)
  281. {
  282. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.MaxF));
  283. }
  284. else if (Op.Size == 1)
  285. {
  286. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.Max));
  287. }
  288. else
  289. {
  290. throw new InvalidOperationException();
  291. }
  292. });
  293. }
  294. public static void Fmin_S(AILEmitterCtx Context)
  295. {
  296. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  297. EmitScalarBinaryOpF(Context, () =>
  298. {
  299. if (Op.Size == 0)
  300. {
  301. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.MinF));
  302. }
  303. else if (Op.Size == 1)
  304. {
  305. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.Min));
  306. }
  307. else
  308. {
  309. throw new InvalidOperationException();
  310. }
  311. });
  312. }
  313. public static void Fmin_V(AILEmitterCtx Context)
  314. {
  315. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  316. int SizeF = Op.Size & 1;
  317. EmitVectorBinaryOpF(Context, () =>
  318. {
  319. if (SizeF == 0)
  320. {
  321. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.MinF));
  322. }
  323. else if (SizeF == 1)
  324. {
  325. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.Min));
  326. }
  327. else
  328. {
  329. throw new InvalidOperationException();
  330. }
  331. });
  332. }
  333. public static void Fmaxnm_S(AILEmitterCtx Context)
  334. {
  335. Fmax_S(Context);
  336. }
  337. public static void Fminnm_S(AILEmitterCtx Context)
  338. {
  339. Fmin_S(Context);
  340. }
  341. public static void Fmla_Se(AILEmitterCtx Context)
  342. {
  343. EmitScalarTernaryOpByElemF(Context, () =>
  344. {
  345. Context.Emit(OpCodes.Mul);
  346. Context.Emit(OpCodes.Add);
  347. });
  348. }
  349. public static void Fmla_V(AILEmitterCtx Context)
  350. {
  351. EmitVectorTernaryOpF(Context, () =>
  352. {
  353. Context.Emit(OpCodes.Mul);
  354. Context.Emit(OpCodes.Add);
  355. });
  356. }
  357. public static void Fmla_Ve(AILEmitterCtx Context)
  358. {
  359. EmitVectorTernaryOpByElemF(Context, () =>
  360. {
  361. Context.Emit(OpCodes.Mul);
  362. Context.Emit(OpCodes.Add);
  363. });
  364. }
  365. public static void Fmls_V(AILEmitterCtx Context)
  366. {
  367. EmitVectorTernaryOpF(Context, () =>
  368. {
  369. Context.Emit(OpCodes.Mul);
  370. Context.Emit(OpCodes.Sub);
  371. });
  372. }
  373. public static void Fmls_Ve(AILEmitterCtx Context)
  374. {
  375. EmitVectorTernaryOpByElemF(Context, () =>
  376. {
  377. Context.Emit(OpCodes.Mul);
  378. Context.Emit(OpCodes.Sub);
  379. });
  380. }
  381. public static void Fmsub_S(AILEmitterCtx Context)
  382. {
  383. EmitScalarTernaryRaOpF(Context, () =>
  384. {
  385. Context.Emit(OpCodes.Mul);
  386. Context.Emit(OpCodes.Sub);
  387. });
  388. }
  389. public static void Fmul_S(AILEmitterCtx Context)
  390. {
  391. if (AOptimizations.UseSse && AOptimizations.UseSse2)
  392. {
  393. EmitSseOrSse2CallF(Context, nameof(Sse.MultiplyScalar));
  394. }
  395. else
  396. {
  397. EmitScalarBinaryOpF(Context, () => Context.Emit(OpCodes.Mul));
  398. }
  399. }
  400. public static void Fmul_Se(AILEmitterCtx Context)
  401. {
  402. EmitScalarBinaryOpByElemF(Context, () => Context.Emit(OpCodes.Mul));
  403. }
  404. public static void Fmul_V(AILEmitterCtx Context)
  405. {
  406. if (AOptimizations.UseSse && AOptimizations.UseSse2)
  407. {
  408. EmitSseOrSse2CallF(Context, nameof(Sse.Multiply));
  409. }
  410. else
  411. {
  412. EmitVectorBinaryOpF(Context, () => Context.Emit(OpCodes.Mul));
  413. }
  414. }
  415. public static void Fmul_Ve(AILEmitterCtx Context)
  416. {
  417. EmitVectorBinaryOpByElemF(Context, () => Context.Emit(OpCodes.Mul));
  418. }
  419. public static void Fneg_S(AILEmitterCtx Context)
  420. {
  421. EmitScalarUnaryOpF(Context, () => Context.Emit(OpCodes.Neg));
  422. }
  423. public static void Fneg_V(AILEmitterCtx Context)
  424. {
  425. EmitVectorUnaryOpF(Context, () => Context.Emit(OpCodes.Neg));
  426. }
  427. public static void Fnmadd_S(AILEmitterCtx Context)
  428. {
  429. AOpCodeSimdReg Op = (AOpCodeSimdReg)Context.CurrOp;
  430. int SizeF = Op.Size & 1;
  431. EmitVectorExtractF(Context, Op.Rn, 0, SizeF);
  432. Context.Emit(OpCodes.Neg);
  433. EmitVectorExtractF(Context, Op.Rm, 0, SizeF);
  434. Context.Emit(OpCodes.Mul);
  435. EmitVectorExtractF(Context, Op.Ra, 0, SizeF);
  436. Context.Emit(OpCodes.Sub);
  437. EmitScalarSetF(Context, Op.Rd, SizeF);
  438. }
  439. public static void Fnmsub_S(AILEmitterCtx Context)
  440. {
  441. AOpCodeSimdReg Op = (AOpCodeSimdReg)Context.CurrOp;
  442. int SizeF = Op.Size & 1;
  443. EmitVectorExtractF(Context, Op.Rn, 0, SizeF);
  444. EmitVectorExtractF(Context, Op.Rm, 0, SizeF);
  445. Context.Emit(OpCodes.Mul);
  446. EmitVectorExtractF(Context, Op.Ra, 0, SizeF);
  447. Context.Emit(OpCodes.Sub);
  448. EmitScalarSetF(Context, Op.Rd, SizeF);
  449. }
  450. public static void Fnmul_S(AILEmitterCtx Context)
  451. {
  452. EmitScalarBinaryOpF(Context, () =>
  453. {
  454. Context.Emit(OpCodes.Mul);
  455. Context.Emit(OpCodes.Neg);
  456. });
  457. }
  458. public static void Frecpe_S(AILEmitterCtx Context)
  459. {
  460. EmitScalarUnaryOpF(Context, () =>
  461. {
  462. EmitUnarySoftFloatCall(Context, nameof(ASoftFloat.RecipEstimate));
  463. });
  464. }
  465. public static void Frecpe_V(AILEmitterCtx Context)
  466. {
  467. EmitVectorUnaryOpF(Context, () =>
  468. {
  469. EmitUnarySoftFloatCall(Context, nameof(ASoftFloat.RecipEstimate));
  470. });
  471. }
  472. public static void Frecps_S(AILEmitterCtx Context)
  473. {
  474. EmitScalarBinaryOpF(Context, () =>
  475. {
  476. EmitBinarySoftFloatCall(Context, nameof(ASoftFloat.RecipStep));
  477. });
  478. }
  479. public static void Frecps_V(AILEmitterCtx Context)
  480. {
  481. EmitVectorBinaryOpF(Context, () =>
  482. {
  483. EmitBinarySoftFloatCall(Context, nameof(ASoftFloat.RecipStep));
  484. });
  485. }
  486. public static void Frinta_S(AILEmitterCtx Context)
  487. {
  488. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  489. EmitVectorExtractF(Context, Op.Rn, 0, Op.Size);
  490. EmitRoundMathCall(Context, MidpointRounding.AwayFromZero);
  491. EmitScalarSetF(Context, Op.Rd, Op.Size);
  492. }
  493. public static void Frinta_V(AILEmitterCtx Context)
  494. {
  495. EmitVectorUnaryOpF(Context, () =>
  496. {
  497. EmitRoundMathCall(Context, MidpointRounding.AwayFromZero);
  498. });
  499. }
  500. public static void Frinti_S(AILEmitterCtx Context)
  501. {
  502. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  503. EmitScalarUnaryOpF(Context, () =>
  504. {
  505. Context.EmitLdarg(ATranslatedSub.StateArgIdx);
  506. Context.EmitCallPropGet(typeof(AThreadState), nameof(AThreadState.Fpcr));
  507. if (Op.Size == 0)
  508. {
  509. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.RoundF));
  510. }
  511. else if (Op.Size == 1)
  512. {
  513. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.Round));
  514. }
  515. else
  516. {
  517. throw new InvalidOperationException();
  518. }
  519. });
  520. }
  521. public static void Frinti_V(AILEmitterCtx Context)
  522. {
  523. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  524. int SizeF = Op.Size & 1;
  525. EmitVectorUnaryOpF(Context, () =>
  526. {
  527. Context.EmitLdarg(ATranslatedSub.StateArgIdx);
  528. Context.EmitCallPropGet(typeof(AThreadState), nameof(AThreadState.Fpcr));
  529. if (SizeF == 0)
  530. {
  531. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.RoundF));
  532. }
  533. else if (SizeF == 1)
  534. {
  535. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.Round));
  536. }
  537. else
  538. {
  539. throw new InvalidOperationException();
  540. }
  541. });
  542. }
  543. public static void Frintm_S(AILEmitterCtx Context)
  544. {
  545. EmitScalarUnaryOpF(Context, () =>
  546. {
  547. EmitUnaryMathCall(Context, nameof(Math.Floor));
  548. });
  549. }
  550. public static void Frintm_V(AILEmitterCtx Context)
  551. {
  552. EmitVectorUnaryOpF(Context, () =>
  553. {
  554. EmitUnaryMathCall(Context, nameof(Math.Floor));
  555. });
  556. }
  557. public static void Frintn_S(AILEmitterCtx Context)
  558. {
  559. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  560. EmitVectorExtractF(Context, Op.Rn, 0, Op.Size);
  561. EmitRoundMathCall(Context, MidpointRounding.ToEven);
  562. EmitScalarSetF(Context, Op.Rd, Op.Size);
  563. }
  564. public static void Frintn_V(AILEmitterCtx Context)
  565. {
  566. EmitVectorUnaryOpF(Context, () =>
  567. {
  568. EmitRoundMathCall(Context, MidpointRounding.ToEven);
  569. });
  570. }
  571. public static void Frintp_S(AILEmitterCtx Context)
  572. {
  573. EmitScalarUnaryOpF(Context, () =>
  574. {
  575. EmitUnaryMathCall(Context, nameof(Math.Ceiling));
  576. });
  577. }
  578. public static void Frintp_V(AILEmitterCtx Context)
  579. {
  580. EmitVectorUnaryOpF(Context, () =>
  581. {
  582. EmitUnaryMathCall(Context, nameof(Math.Ceiling));
  583. });
  584. }
  585. public static void Frintx_S(AILEmitterCtx Context)
  586. {
  587. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  588. EmitScalarUnaryOpF(Context, () =>
  589. {
  590. Context.EmitLdarg(ATranslatedSub.StateArgIdx);
  591. Context.EmitCallPropGet(typeof(AThreadState), nameof(AThreadState.Fpcr));
  592. if (Op.Size == 0)
  593. {
  594. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.RoundF));
  595. }
  596. else if (Op.Size == 1)
  597. {
  598. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.Round));
  599. }
  600. else
  601. {
  602. throw new InvalidOperationException();
  603. }
  604. });
  605. }
  606. public static void Frintx_V(AILEmitterCtx Context)
  607. {
  608. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  609. EmitVectorUnaryOpF(Context, () =>
  610. {
  611. Context.EmitLdarg(ATranslatedSub.StateArgIdx);
  612. Context.EmitCallPropGet(typeof(AThreadState), nameof(AThreadState.Fpcr));
  613. if (Op.Size == 0)
  614. {
  615. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.RoundF));
  616. }
  617. else if (Op.Size == 1)
  618. {
  619. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.Round));
  620. }
  621. else
  622. {
  623. throw new InvalidOperationException();
  624. }
  625. });
  626. }
  627. public static void Frsqrte_S(AILEmitterCtx Context)
  628. {
  629. EmitScalarUnaryOpF(Context, () =>
  630. {
  631. EmitUnarySoftFloatCall(Context, nameof(ASoftFloat.InvSqrtEstimate));
  632. });
  633. }
  634. public static void Frsqrte_V(AILEmitterCtx Context)
  635. {
  636. EmitVectorUnaryOpF(Context, () =>
  637. {
  638. EmitUnarySoftFloatCall(Context, nameof(ASoftFloat.InvSqrtEstimate));
  639. });
  640. }
  641. public static void Frsqrts_S(AILEmitterCtx Context)
  642. {
  643. EmitFrsqrts(Context, 0, Scalar: true);
  644. }
  645. public static void Frsqrts_V(AILEmitterCtx Context)
  646. {
  647. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  648. int SizeF = Op.Size & 1;
  649. int Bytes = Op.GetBitsCount() >> 3;
  650. for (int Index = 0; Index < Bytes >> SizeF + 2; Index++)
  651. {
  652. EmitFrsqrts(Context, Index, Scalar: false);
  653. }
  654. if (Op.RegisterSize == ARegisterSize.SIMD64)
  655. {
  656. EmitVectorZeroUpper(Context, Op.Rd);
  657. }
  658. }
  659. private static void EmitFrsqrts(AILEmitterCtx Context, int Index, bool Scalar)
  660. {
  661. AOpCodeSimdReg Op = (AOpCodeSimdReg)Context.CurrOp;
  662. int SizeF = Op.Size & 1;
  663. if (SizeF == 0)
  664. {
  665. Context.EmitLdc_R4(3);
  666. }
  667. else /* if (SizeF == 1) */
  668. {
  669. Context.EmitLdc_R8(3);
  670. }
  671. EmitVectorExtractF(Context, Op.Rn, Index, SizeF);
  672. EmitVectorExtractF(Context, Op.Rm, Index, SizeF);
  673. Context.Emit(OpCodes.Mul);
  674. Context.Emit(OpCodes.Sub);
  675. if (SizeF == 0)
  676. {
  677. Context.EmitLdc_R4(0.5f);
  678. }
  679. else /* if (SizeF == 1) */
  680. {
  681. Context.EmitLdc_R8(0.5);
  682. }
  683. Context.Emit(OpCodes.Mul);
  684. if (Scalar)
  685. {
  686. EmitVectorZeroAll(Context, Op.Rd);
  687. }
  688. EmitVectorInsertF(Context, Op.Rd, Index, SizeF);
  689. }
  690. public static void Fsqrt_S(AILEmitterCtx Context)
  691. {
  692. EmitScalarUnaryOpF(Context, () =>
  693. {
  694. EmitUnaryMathCall(Context, nameof(Math.Sqrt));
  695. });
  696. }
  697. public static void Fsub_S(AILEmitterCtx Context)
  698. {
  699. if (AOptimizations.UseSse && AOptimizations.UseSse2)
  700. {
  701. EmitSseOrSse2CallF(Context, nameof(Sse.SubtractScalar));
  702. }
  703. else
  704. {
  705. EmitScalarBinaryOpF(Context, () => Context.Emit(OpCodes.Sub));
  706. }
  707. }
  708. public static void Fsub_V(AILEmitterCtx Context)
  709. {
  710. if (AOptimizations.UseSse && AOptimizations.UseSse2)
  711. {
  712. EmitSseOrSse2CallF(Context, nameof(Sse.Subtract));
  713. }
  714. else
  715. {
  716. EmitVectorBinaryOpF(Context, () => Context.Emit(OpCodes.Sub));
  717. }
  718. }
  719. public static void Mla_V(AILEmitterCtx Context)
  720. {
  721. EmitVectorTernaryOpZx(Context, () =>
  722. {
  723. Context.Emit(OpCodes.Mul);
  724. Context.Emit(OpCodes.Add);
  725. });
  726. }
  727. public static void Mla_Ve(AILEmitterCtx Context)
  728. {
  729. EmitVectorTernaryOpByElemZx(Context, () =>
  730. {
  731. Context.Emit(OpCodes.Mul);
  732. Context.Emit(OpCodes.Add);
  733. });
  734. }
  735. public static void Mls_V(AILEmitterCtx Context)
  736. {
  737. EmitVectorTernaryOpZx(Context, () =>
  738. {
  739. Context.Emit(OpCodes.Mul);
  740. Context.Emit(OpCodes.Sub);
  741. });
  742. }
  743. public static void Mul_V(AILEmitterCtx Context)
  744. {
  745. EmitVectorBinaryOpZx(Context, () => Context.Emit(OpCodes.Mul));
  746. }
  747. public static void Mul_Ve(AILEmitterCtx Context)
  748. {
  749. EmitVectorBinaryOpByElemZx(Context, () => Context.Emit(OpCodes.Mul));
  750. }
  751. public static void Neg_S(AILEmitterCtx Context)
  752. {
  753. EmitScalarUnaryOpSx(Context, () => Context.Emit(OpCodes.Neg));
  754. }
  755. public static void Neg_V(AILEmitterCtx Context)
  756. {
  757. EmitVectorUnaryOpSx(Context, () => Context.Emit(OpCodes.Neg));
  758. }
  759. public static void Raddhn_V(AILEmitterCtx Context)
  760. {
  761. EmitHighNarrow(Context, () => Context.Emit(OpCodes.Add), Round: true);
  762. }
  763. public static void Rsubhn_V(AILEmitterCtx Context)
  764. {
  765. EmitHighNarrow(Context, () => Context.Emit(OpCodes.Sub), Round: true);
  766. }
  767. public static void Saba_V(AILEmitterCtx Context)
  768. {
  769. EmitVectorTernaryOpSx(Context, () =>
  770. {
  771. Context.Emit(OpCodes.Sub);
  772. EmitAbs(Context);
  773. Context.Emit(OpCodes.Add);
  774. });
  775. }
  776. public static void Sabal_V(AILEmitterCtx Context)
  777. {
  778. EmitVectorWidenRnRmTernaryOpSx(Context, () =>
  779. {
  780. Context.Emit(OpCodes.Sub);
  781. EmitAbs(Context);
  782. Context.Emit(OpCodes.Add);
  783. });
  784. }
  785. public static void Sabd_V(AILEmitterCtx Context)
  786. {
  787. EmitVectorBinaryOpSx(Context, () =>
  788. {
  789. Context.Emit(OpCodes.Sub);
  790. EmitAbs(Context);
  791. });
  792. }
  793. public static void Sabdl_V(AILEmitterCtx Context)
  794. {
  795. EmitVectorWidenRnRmBinaryOpSx(Context, () =>
  796. {
  797. Context.Emit(OpCodes.Sub);
  798. EmitAbs(Context);
  799. });
  800. }
  801. public static void Saddw_V(AILEmitterCtx Context)
  802. {
  803. EmitVectorWidenRmBinaryOpSx(Context, () => Context.Emit(OpCodes.Add));
  804. }
  805. public static void Smax_V(AILEmitterCtx Context)
  806. {
  807. Type[] Types = new Type[] { typeof(long), typeof(long) };
  808. MethodInfo MthdInfo = typeof(Math).GetMethod(nameof(Math.Max), Types);
  809. EmitVectorBinaryOpSx(Context, () => Context.EmitCall(MthdInfo));
  810. }
  811. public static void Smaxp_V(AILEmitterCtx Context)
  812. {
  813. Type[] Types = new Type[] { typeof(long), typeof(long) };
  814. MethodInfo MthdInfo = typeof(Math).GetMethod(nameof(Math.Max), Types);
  815. EmitVectorPairwiseOpSx(Context, () => Context.EmitCall(MthdInfo));
  816. }
  817. public static void Smin_V(AILEmitterCtx Context)
  818. {
  819. Type[] Types = new Type[] { typeof(long), typeof(long) };
  820. MethodInfo MthdInfo = typeof(Math).GetMethod(nameof(Math.Min), Types);
  821. EmitVectorBinaryOpSx(Context, () => Context.EmitCall(MthdInfo));
  822. }
  823. public static void Sminp_V(AILEmitterCtx Context)
  824. {
  825. Type[] Types = new Type[] { typeof(long), typeof(long) };
  826. MethodInfo MthdInfo = typeof(Math).GetMethod(nameof(Math.Min), Types);
  827. EmitVectorPairwiseOpSx(Context, () => Context.EmitCall(MthdInfo));
  828. }
  829. public static void Smlal_V(AILEmitterCtx Context)
  830. {
  831. EmitVectorWidenRnRmTernaryOpSx(Context, () =>
  832. {
  833. Context.Emit(OpCodes.Mul);
  834. Context.Emit(OpCodes.Add);
  835. });
  836. }
  837. public static void Smlsl_V(AILEmitterCtx Context)
  838. {
  839. EmitVectorWidenRnRmTernaryOpSx(Context, () =>
  840. {
  841. Context.Emit(OpCodes.Mul);
  842. Context.Emit(OpCodes.Sub);
  843. });
  844. }
  845. public static void Smull_V(AILEmitterCtx Context)
  846. {
  847. EmitVectorWidenRnRmBinaryOpSx(Context, () => Context.Emit(OpCodes.Mul));
  848. }
  849. public static void Sqxtn_S(AILEmitterCtx Context)
  850. {
  851. EmitScalarSaturatingNarrowOpSxSx(Context, () => { });
  852. }
  853. public static void Sqxtn_V(AILEmitterCtx Context)
  854. {
  855. EmitVectorSaturatingNarrowOpSxSx(Context, () => { });
  856. }
  857. public static void Sqxtun_S(AILEmitterCtx Context)
  858. {
  859. EmitScalarSaturatingNarrowOpSxZx(Context, () => { });
  860. }
  861. public static void Sqxtun_V(AILEmitterCtx Context)
  862. {
  863. EmitVectorSaturatingNarrowOpSxZx(Context, () => { });
  864. }
  865. public static void Sub_S(AILEmitterCtx Context)
  866. {
  867. EmitScalarBinaryOpZx(Context, () => Context.Emit(OpCodes.Sub));
  868. }
  869. public static void Sub_V(AILEmitterCtx Context)
  870. {
  871. if (AOptimizations.UseSse2)
  872. {
  873. EmitSse2Call(Context, nameof(Sse2.Subtract));
  874. }
  875. else
  876. {
  877. EmitVectorBinaryOpZx(Context, () => Context.Emit(OpCodes.Sub));
  878. }
  879. }
  880. public static void Subhn_V(AILEmitterCtx Context)
  881. {
  882. EmitHighNarrow(Context, () => Context.Emit(OpCodes.Sub), Round: false);
  883. }
  884. public static void Uaba_V(AILEmitterCtx Context)
  885. {
  886. EmitVectorTernaryOpZx(Context, () =>
  887. {
  888. Context.Emit(OpCodes.Sub);
  889. EmitAbs(Context);
  890. Context.Emit(OpCodes.Add);
  891. });
  892. }
  893. public static void Uabal_V(AILEmitterCtx Context)
  894. {
  895. EmitVectorWidenRnRmTernaryOpZx(Context, () =>
  896. {
  897. Context.Emit(OpCodes.Sub);
  898. EmitAbs(Context);
  899. Context.Emit(OpCodes.Add);
  900. });
  901. }
  902. public static void Uabd_V(AILEmitterCtx Context)
  903. {
  904. EmitVectorBinaryOpZx(Context, () =>
  905. {
  906. Context.Emit(OpCodes.Sub);
  907. EmitAbs(Context);
  908. });
  909. }
  910. public static void Uabdl_V(AILEmitterCtx Context)
  911. {
  912. EmitVectorWidenRnRmBinaryOpZx(Context, () =>
  913. {
  914. Context.Emit(OpCodes.Sub);
  915. EmitAbs(Context);
  916. });
  917. }
  918. public static void Uaddl_V(AILEmitterCtx Context)
  919. {
  920. EmitVectorWidenRnRmBinaryOpZx(Context, () => Context.Emit(OpCodes.Add));
  921. }
  922. public static void Uaddlv_V(AILEmitterCtx Context)
  923. {
  924. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  925. int Bytes = Op.GetBitsCount() >> 3;
  926. int Elems = Bytes >> Op.Size;
  927. EmitVectorExtractZx(Context, Op.Rn, 0, Op.Size);
  928. for (int Index = 1; Index < Elems; Index++)
  929. {
  930. EmitVectorExtractZx(Context, Op.Rn, Index, Op.Size);
  931. Context.Emit(OpCodes.Add);
  932. }
  933. EmitScalarSet(Context, Op.Rd, Op.Size + 1);
  934. }
  935. public static void Uaddw_V(AILEmitterCtx Context)
  936. {
  937. EmitVectorWidenRmBinaryOpZx(Context, () => Context.Emit(OpCodes.Add));
  938. }
  939. public static void Uhadd_V(AILEmitterCtx Context)
  940. {
  941. EmitVectorBinaryOpZx(Context, () =>
  942. {
  943. Context.Emit(OpCodes.Add);
  944. Context.EmitLdc_I4(1);
  945. Context.Emit(OpCodes.Shr_Un);
  946. });
  947. }
  948. public static void Umin_V(AILEmitterCtx Context)
  949. {
  950. Type[] Types = new Type[] { typeof(ulong), typeof(ulong) };
  951. MethodInfo MthdInfo = typeof(Math).GetMethod(nameof(Math.Min), Types);
  952. EmitVectorBinaryOpZx(Context, () => Context.EmitCall(MthdInfo));
  953. }
  954. public static void Uminp_V(AILEmitterCtx Context)
  955. {
  956. Type[] Types = new Type[] { typeof(ulong), typeof(ulong) };
  957. MethodInfo MthdInfo = typeof(Math).GetMethod(nameof(Math.Min), Types);
  958. EmitVectorPairwiseOpZx(Context, () => Context.EmitCall(MthdInfo));
  959. }
  960. public static void Umax_V(AILEmitterCtx Context)
  961. {
  962. Type[] Types = new Type[] { typeof(ulong), typeof(ulong) };
  963. MethodInfo MthdInfo = typeof(Math).GetMethod(nameof(Math.Max), Types);
  964. EmitVectorBinaryOpZx(Context, () => Context.EmitCall(MthdInfo));
  965. }
  966. public static void Umaxp_V(AILEmitterCtx Context)
  967. {
  968. Type[] Types = new Type[] { typeof(ulong), typeof(ulong) };
  969. MethodInfo MthdInfo = typeof(Math).GetMethod(nameof(Math.Max), Types);
  970. EmitVectorPairwiseOpZx(Context, () => Context.EmitCall(MthdInfo));
  971. }
  972. public static void Umull_V(AILEmitterCtx Context)
  973. {
  974. EmitVectorWidenRnRmBinaryOpZx(Context, () => Context.Emit(OpCodes.Mul));
  975. }
  976. public static void Uqxtn_S(AILEmitterCtx Context)
  977. {
  978. EmitScalarSaturatingNarrowOpZxZx(Context, () => { });
  979. }
  980. public static void Uqxtn_V(AILEmitterCtx Context)
  981. {
  982. EmitVectorSaturatingNarrowOpZxZx(Context, () => { });
  983. }
  984. }
  985. }