AInstEmitSimdArithmetic.cs 37 KB

12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061626364656667686970717273747576777879808182838485868788899091929394959697989910010110210310410510610710810911011111211311411511611711811912012112212312412512612712812913013113213313413513613713813914014114214314414514614714814915015115215315415515615715815916016116216316416516616716816917017117217317417517617717817918018118218318418518618718818919019119219319419519619719819920020120220320420520620720820921021121221321421521621721821922022122222322422522622722822923023123223323423523623723823924024124224324424524624724824925025125225325425525625725825926026126226326426526626726826927027127227327427527627727827928028128228328428528628728828929029129229329429529629729829930030130230330430530630730830931031131231331431531631731831932032132232332432532632732832933033133233333433533633733833934034134234334434534634734834935035135235335435535635735835936036136236336436536636736836937037137237337437537637737837938038138238338438538638738838939039139239339439539639739839940040140240340440540640740840941041141241341441541641741841942042142242342442542642742842943043143243343443543643743843944044144244344444544644744844945045145245345445545645745845946046146246346446546646746846947047147247347447547647747847948048148248348448548648748848949049149249349449549649749849950050150250350450550650750850951051151251351451551651751851952052152252352452552652752852953053153253353453553653753853954054154254354454554654754854955055155255355455555655755855956056156256356456556656756856957057157257357457557657757857958058158258358458558658758858959059159259359459559659759859960060160260360460560660760860961061161261361461561661761861962062162262362462562662762862963063163263363463563663763863964064164264364464564664764864965065165265365465565665765865966066166266366466566666766866967067167267367467567667767867968068168268368468568668768868969069169269369469569669769869970070170270370470570670770870971071171271371471571671771871972072172272372472572672772872973073173273373473573673773873974074174274374474574674774874975075175275375475575675775875976076176276376476576676776876977077177277377477577677777877978078178278378478578678778878979079179279379479579679779879980080180280380480580680780880981081181281381481581681781881982082182282382482582682782882983083183283383483583683783883984084184284384484584684784884985085185285385485585685785885986086186286386486586686786886987087187287387487587687787887988088188288388488588688788888989089189289389489589689789889990090190290390490590690790890991091191291391491591691791891992092192292392492592692792892993093193293393493593693793893994094194294394494594694794894995095195295395495595695795895996096196296396496596696796896997097197297397497597697797897998098198298398498598698798898999099199299399499599699799899910001001100210031004100510061007100810091010101110121013101410151016101710181019102010211022102310241025102610271028102910301031103210331034103510361037103810391040104110421043104410451046104710481049105010511052105310541055105610571058105910601061106210631064106510661067106810691070107110721073107410751076107710781079108010811082108310841085108610871088108910901091109210931094109510961097109810991100110111021103110411051106110711081109111011111112111311141115111611171118111911201121112211231124112511261127112811291130113111321133113411351136113711381139114011411142114311441145114611471148114911501151115211531154115511561157115811591160116111621163116411651166116711681169117011711172117311741175117611771178117911801181118211831184118511861187118811891190119111921193119411951196119711981199120012011202120312041205120612071208120912101211121212131214121512161217121812191220122112221223122412251226122712281229123012311232123312341235123612371238123912401241124212431244124512461247124812491250125112521253125412551256125712581259126012611262126312641265126612671268126912701271127212731274127512761277127812791280128112821283
  1. using ChocolArm64.Decoder;
  2. using ChocolArm64.State;
  3. using ChocolArm64.Translation;
  4. using System;
  5. using System.Reflection;
  6. using System.Reflection.Emit;
  7. using System.Runtime.Intrinsics.X86;
  8. using static ChocolArm64.Instruction.AInstEmitSimdHelper;
  9. namespace ChocolArm64.Instruction
  10. {
  11. static partial class AInstEmit
  12. {
  13. public static void Abs_S(AILEmitterCtx Context)
  14. {
  15. EmitScalarUnaryOpSx(Context, () => EmitAbs(Context));
  16. }
  17. public static void Abs_V(AILEmitterCtx Context)
  18. {
  19. EmitVectorUnaryOpSx(Context, () => EmitAbs(Context));
  20. }
  21. public static void Add_S(AILEmitterCtx Context)
  22. {
  23. EmitScalarBinaryOpZx(Context, () => Context.Emit(OpCodes.Add));
  24. }
  25. public static void Add_V(AILEmitterCtx Context)
  26. {
  27. if (AOptimizations.UseSse2)
  28. {
  29. EmitSse2Call(Context, nameof(Sse2.Add));
  30. }
  31. else
  32. {
  33. EmitVectorBinaryOpZx(Context, () => Context.Emit(OpCodes.Add));
  34. }
  35. }
  36. public static void Addhn_V(AILEmitterCtx Context)
  37. {
  38. EmitHighNarrow(Context, () => Context.Emit(OpCodes.Add), Round: false);
  39. }
  40. public static void Addp_S(AILEmitterCtx Context)
  41. {
  42. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  43. EmitVectorExtractZx(Context, Op.Rn, 0, Op.Size);
  44. EmitVectorExtractZx(Context, Op.Rn, 1, Op.Size);
  45. Context.Emit(OpCodes.Add);
  46. EmitScalarSet(Context, Op.Rd, Op.Size);
  47. }
  48. public static void Addp_V(AILEmitterCtx Context)
  49. {
  50. EmitVectorPairwiseOpZx(Context, () => Context.Emit(OpCodes.Add));
  51. }
  52. public static void Addv_V(AILEmitterCtx Context)
  53. {
  54. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  55. int Bytes = Context.CurrOp.GetBitsCount() >> 3;
  56. EmitVectorExtractZx(Context, Op.Rn, 0, Op.Size);
  57. for (int Index = 1; Index < (Bytes >> Op.Size); Index++)
  58. {
  59. EmitVectorExtractZx(Context, Op.Rn, Index, Op.Size);
  60. Context.Emit(OpCodes.Add);
  61. }
  62. EmitScalarSet(Context, Op.Rd, Op.Size);
  63. }
  64. public static void Cls_V(AILEmitterCtx Context)
  65. {
  66. MethodInfo MthdInfo = typeof(ASoftFallback).GetMethod(nameof(ASoftFallback.CountLeadingSigns));
  67. EmitCountLeadingBits(Context, () => Context.EmitCall(MthdInfo));
  68. }
  69. public static void Clz_V(AILEmitterCtx Context)
  70. {
  71. MethodInfo MthdInfo = typeof(ASoftFallback).GetMethod(nameof(ASoftFallback.CountLeadingZeros));
  72. EmitCountLeadingBits(Context, () => Context.EmitCall(MthdInfo));
  73. }
  74. private static void EmitCountLeadingBits(AILEmitterCtx Context, Action Emit)
  75. {
  76. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  77. int Bytes = Context.CurrOp.GetBitsCount() >> 3;
  78. for (int Index = 0; Index < (Bytes >> Op.Size); Index++)
  79. {
  80. EmitVectorExtractZx(Context, Op.Rn, Index, Op.Size);
  81. Context.EmitLdc_I4(8 << Op.Size);
  82. Emit();
  83. EmitVectorInsert(Context, Op.Rd, Index, Op.Size);
  84. }
  85. if (Op.RegisterSize == ARegisterSize.SIMD64)
  86. {
  87. EmitVectorZeroUpper(Context, Op.Rd);
  88. }
  89. }
  90. public static void Cnt_V(AILEmitterCtx Context)
  91. {
  92. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  93. int Elems = Op.RegisterSize == ARegisterSize.SIMD128 ? 16 : 8;
  94. for (int Index = 0; Index < Elems; Index++)
  95. {
  96. EmitVectorExtractZx(Context, Op.Rn, Index, 0);
  97. Context.Emit(OpCodes.Conv_U4);
  98. ASoftFallback.EmitCall(Context, nameof(ASoftFallback.CountSetBits8));
  99. Context.Emit(OpCodes.Conv_U8);
  100. EmitVectorInsert(Context, Op.Rd, Index, 0);
  101. }
  102. if (Op.RegisterSize == ARegisterSize.SIMD64)
  103. {
  104. EmitVectorZeroUpper(Context, Op.Rd);
  105. }
  106. }
  107. private static void EmitAbs(AILEmitterCtx Context)
  108. {
  109. AILLabel LblTrue = new AILLabel();
  110. Context.Emit(OpCodes.Dup);
  111. Context.Emit(OpCodes.Ldc_I4_0);
  112. Context.Emit(OpCodes.Bge_S, LblTrue);
  113. Context.Emit(OpCodes.Neg);
  114. Context.MarkLabel(LblTrue);
  115. }
  116. private static void EmitHighNarrow(AILEmitterCtx Context, Action Emit, bool Round)
  117. {
  118. AOpCodeSimdReg Op = (AOpCodeSimdReg)Context.CurrOp;
  119. int Elems = 8 >> Op.Size;
  120. int ESize = 8 << Op.Size;
  121. int Part = Op.RegisterSize == ARegisterSize.SIMD128 ? Elems : 0;
  122. long RoundConst = 1L << (ESize - 1);
  123. for (int Index = 0; Index < Elems; Index++)
  124. {
  125. EmitVectorExtractZx(Context, Op.Rn, Index, Op.Size + 1);
  126. EmitVectorExtractZx(Context, Op.Rm, Index, Op.Size + 1);
  127. Emit();
  128. if (Round)
  129. {
  130. Context.EmitLdc_I8(RoundConst);
  131. Context.Emit(OpCodes.Add);
  132. }
  133. Context.EmitLsr(ESize);
  134. EmitVectorInsert(Context, Op.Rd, Part + Index, Op.Size);
  135. }
  136. if (Part == 0)
  137. {
  138. EmitVectorZeroUpper(Context, Op.Rd);
  139. }
  140. }
  141. private static void EmitSaturatingExtNarrow(AILEmitterCtx Context, bool SignedSrc, bool SignedDst, bool Scalar)
  142. {
  143. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  144. int Elems = (!Scalar ? 8 >> Op.Size : 1);
  145. int ESize = 8 << Op.Size;
  146. int Part = (!Scalar & (Op.RegisterSize == ARegisterSize.SIMD128) ? Elems : 0);
  147. int TMaxValue = (SignedDst ? (1 << (ESize - 1)) - 1 : (int)((1L << ESize) - 1L));
  148. int TMinValue = (SignedDst ? -((1 << (ESize - 1))) : 0);
  149. Context.EmitLdc_I8(0L);
  150. Context.EmitSttmp();
  151. for (int Index = 0; Index < Elems; Index++)
  152. {
  153. AILLabel LblLe = new AILLabel();
  154. AILLabel LblGeEnd = new AILLabel();
  155. EmitVectorExtract(Context, Op.Rn, Index, Op.Size + 1, SignedSrc);
  156. Context.Emit(OpCodes.Dup);
  157. Context.EmitLdc_I4(TMaxValue);
  158. Context.Emit(OpCodes.Conv_U8);
  159. Context.Emit(SignedSrc ? OpCodes.Ble_S : OpCodes.Ble_Un_S, LblLe);
  160. Context.Emit(OpCodes.Pop);
  161. Context.EmitLdc_I4(TMaxValue);
  162. Context.EmitLdc_I8(0x8000000L);
  163. Context.EmitSttmp();
  164. Context.Emit(OpCodes.Br_S, LblGeEnd);
  165. Context.MarkLabel(LblLe);
  166. Context.Emit(OpCodes.Dup);
  167. Context.EmitLdc_I4(TMinValue);
  168. Context.Emit(OpCodes.Conv_I8);
  169. Context.Emit(SignedSrc ? OpCodes.Bge_S : OpCodes.Bge_Un_S, LblGeEnd);
  170. Context.Emit(OpCodes.Pop);
  171. Context.EmitLdc_I4(TMinValue);
  172. Context.EmitLdc_I8(0x8000000L);
  173. Context.EmitSttmp();
  174. Context.MarkLabel(LblGeEnd);
  175. if (Scalar)
  176. {
  177. EmitVectorZeroLower(Context, Op.Rd);
  178. }
  179. EmitVectorInsert(Context, Op.Rd, Part + Index, Op.Size);
  180. }
  181. if (Part == 0)
  182. {
  183. EmitVectorZeroUpper(Context, Op.Rd);
  184. }
  185. Context.EmitLdarg(ATranslatedSub.StateArgIdx);
  186. Context.EmitLdarg(ATranslatedSub.StateArgIdx);
  187. Context.EmitCallPropGet(typeof(AThreadState), nameof(AThreadState.Fpsr));
  188. Context.EmitLdtmp();
  189. Context.Emit(OpCodes.Conv_I4);
  190. Context.Emit(OpCodes.Or);
  191. Context.EmitCallPropSet(typeof(AThreadState), nameof(AThreadState.Fpsr));
  192. }
  193. public static void Fabd_S(AILEmitterCtx Context)
  194. {
  195. EmitScalarBinaryOpF(Context, () =>
  196. {
  197. Context.Emit(OpCodes.Sub);
  198. EmitUnaryMathCall(Context, nameof(Math.Abs));
  199. });
  200. }
  201. public static void Fabs_S(AILEmitterCtx Context)
  202. {
  203. EmitScalarUnaryOpF(Context, () =>
  204. {
  205. EmitUnaryMathCall(Context, nameof(Math.Abs));
  206. });
  207. }
  208. public static void Fabs_V(AILEmitterCtx Context)
  209. {
  210. EmitVectorUnaryOpF(Context, () =>
  211. {
  212. EmitUnaryMathCall(Context, nameof(Math.Abs));
  213. });
  214. }
  215. public static void Fadd_S(AILEmitterCtx Context)
  216. {
  217. if (AOptimizations.UseSse && AOptimizations.UseSse2)
  218. {
  219. EmitSseOrSse2CallF(Context, nameof(Sse.AddScalar));
  220. }
  221. else
  222. {
  223. EmitScalarBinaryOpF(Context, () => Context.Emit(OpCodes.Add));
  224. }
  225. }
  226. public static void Fadd_V(AILEmitterCtx Context)
  227. {
  228. if (AOptimizations.UseSse && AOptimizations.UseSse2)
  229. {
  230. EmitSseOrSse2CallF(Context, nameof(Sse.Add));
  231. }
  232. else
  233. {
  234. EmitVectorBinaryOpF(Context, () => Context.Emit(OpCodes.Add));
  235. }
  236. }
  237. public static void Faddp_S(AILEmitterCtx Context)
  238. {
  239. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  240. int SizeF = Op.Size & 1;
  241. EmitVectorExtractF(Context, Op.Rn, 0, SizeF);
  242. EmitVectorExtractF(Context, Op.Rn, 1, SizeF);
  243. Context.Emit(OpCodes.Add);
  244. EmitScalarSetF(Context, Op.Rd, SizeF);
  245. }
  246. public static void Faddp_V(AILEmitterCtx Context)
  247. {
  248. AOpCodeSimdReg Op = (AOpCodeSimdReg)Context.CurrOp;
  249. int SizeF = Op.Size & 1;
  250. int Bytes = Context.CurrOp.GetBitsCount() >> 3;
  251. int Elems = Bytes >> SizeF + 2;
  252. int Half = Elems >> 1;
  253. for (int Index = 0; Index < Elems; Index++)
  254. {
  255. int Elem = (Index & (Half - 1)) << 1;
  256. EmitVectorExtractF(Context, Index < Half ? Op.Rn : Op.Rm, Elem + 0, SizeF);
  257. EmitVectorExtractF(Context, Index < Half ? Op.Rn : Op.Rm, Elem + 1, SizeF);
  258. Context.Emit(OpCodes.Add);
  259. EmitVectorInsertTmpF(Context, Index, SizeF);
  260. }
  261. Context.EmitLdvectmp();
  262. Context.EmitStvec(Op.Rd);
  263. if (Op.RegisterSize == ARegisterSize.SIMD64)
  264. {
  265. EmitVectorZeroUpper(Context, Op.Rd);
  266. }
  267. }
  268. public static void Fdiv_S(AILEmitterCtx Context)
  269. {
  270. if (AOptimizations.UseSse && AOptimizations.UseSse2)
  271. {
  272. EmitSseOrSse2CallF(Context, nameof(Sse.DivideScalar));
  273. }
  274. else
  275. {
  276. EmitScalarBinaryOpF(Context, () => Context.Emit(OpCodes.Div));
  277. }
  278. }
  279. public static void Fdiv_V(AILEmitterCtx Context)
  280. {
  281. if (AOptimizations.UseSse && AOptimizations.UseSse2)
  282. {
  283. EmitSseOrSse2CallF(Context, nameof(Sse.Divide));
  284. }
  285. else
  286. {
  287. EmitVectorBinaryOpF(Context, () => Context.Emit(OpCodes.Div));
  288. }
  289. }
  290. public static void Fmadd_S(AILEmitterCtx Context)
  291. {
  292. EmitScalarTernaryRaOpF(Context, () =>
  293. {
  294. Context.Emit(OpCodes.Mul);
  295. Context.Emit(OpCodes.Add);
  296. });
  297. }
  298. public static void Fmax_S(AILEmitterCtx Context)
  299. {
  300. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  301. EmitScalarBinaryOpF(Context, () =>
  302. {
  303. if (Op.Size == 0)
  304. {
  305. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.MaxF));
  306. }
  307. else if (Op.Size == 1)
  308. {
  309. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.Max));
  310. }
  311. else
  312. {
  313. throw new InvalidOperationException();
  314. }
  315. });
  316. }
  317. public static void Fmax_V(AILEmitterCtx Context)
  318. {
  319. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  320. EmitVectorBinaryOpF(Context, () =>
  321. {
  322. if (Op.Size == 0)
  323. {
  324. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.MaxF));
  325. }
  326. else if (Op.Size == 1)
  327. {
  328. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.Max));
  329. }
  330. else
  331. {
  332. throw new InvalidOperationException();
  333. }
  334. });
  335. }
  336. public static void Fmin_S(AILEmitterCtx Context)
  337. {
  338. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  339. EmitScalarBinaryOpF(Context, () =>
  340. {
  341. if (Op.Size == 0)
  342. {
  343. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.MinF));
  344. }
  345. else if (Op.Size == 1)
  346. {
  347. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.Min));
  348. }
  349. else
  350. {
  351. throw new InvalidOperationException();
  352. }
  353. });
  354. }
  355. public static void Fmin_V(AILEmitterCtx Context)
  356. {
  357. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  358. int SizeF = Op.Size & 1;
  359. EmitVectorBinaryOpF(Context, () =>
  360. {
  361. if (SizeF == 0)
  362. {
  363. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.MinF));
  364. }
  365. else if (SizeF == 1)
  366. {
  367. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.Min));
  368. }
  369. else
  370. {
  371. throw new InvalidOperationException();
  372. }
  373. });
  374. }
  375. public static void Fmaxnm_S(AILEmitterCtx Context)
  376. {
  377. Fmax_S(Context);
  378. }
  379. public static void Fminnm_S(AILEmitterCtx Context)
  380. {
  381. Fmin_S(Context);
  382. }
  383. public static void Fmla_Se(AILEmitterCtx Context)
  384. {
  385. EmitScalarTernaryOpByElemF(Context, () =>
  386. {
  387. Context.Emit(OpCodes.Mul);
  388. Context.Emit(OpCodes.Add);
  389. });
  390. }
  391. public static void Fmla_V(AILEmitterCtx Context)
  392. {
  393. EmitVectorTernaryOpF(Context, () =>
  394. {
  395. Context.Emit(OpCodes.Mul);
  396. Context.Emit(OpCodes.Add);
  397. });
  398. }
  399. public static void Fmla_Ve(AILEmitterCtx Context)
  400. {
  401. EmitVectorTernaryOpByElemF(Context, () =>
  402. {
  403. Context.Emit(OpCodes.Mul);
  404. Context.Emit(OpCodes.Add);
  405. });
  406. }
  407. public static void Fmls_V(AILEmitterCtx Context)
  408. {
  409. EmitVectorTernaryOpF(Context, () =>
  410. {
  411. Context.Emit(OpCodes.Mul);
  412. Context.Emit(OpCodes.Sub);
  413. });
  414. }
  415. public static void Fmls_Ve(AILEmitterCtx Context)
  416. {
  417. EmitVectorTernaryOpByElemF(Context, () =>
  418. {
  419. Context.Emit(OpCodes.Mul);
  420. Context.Emit(OpCodes.Sub);
  421. });
  422. }
  423. public static void Fmsub_S(AILEmitterCtx Context)
  424. {
  425. EmitScalarTernaryRaOpF(Context, () =>
  426. {
  427. Context.Emit(OpCodes.Mul);
  428. Context.Emit(OpCodes.Sub);
  429. });
  430. }
  431. public static void Fmul_S(AILEmitterCtx Context)
  432. {
  433. if (AOptimizations.UseSse && AOptimizations.UseSse2)
  434. {
  435. EmitSseOrSse2CallF(Context, nameof(Sse.MultiplyScalar));
  436. }
  437. else
  438. {
  439. EmitScalarBinaryOpF(Context, () => Context.Emit(OpCodes.Mul));
  440. }
  441. }
  442. public static void Fmul_Se(AILEmitterCtx Context)
  443. {
  444. EmitScalarBinaryOpByElemF(Context, () => Context.Emit(OpCodes.Mul));
  445. }
  446. public static void Fmul_V(AILEmitterCtx Context)
  447. {
  448. if (AOptimizations.UseSse && AOptimizations.UseSse2)
  449. {
  450. EmitSseOrSse2CallF(Context, nameof(Sse.Multiply));
  451. }
  452. else
  453. {
  454. EmitVectorBinaryOpF(Context, () => Context.Emit(OpCodes.Mul));
  455. }
  456. }
  457. public static void Fmul_Ve(AILEmitterCtx Context)
  458. {
  459. EmitVectorBinaryOpByElemF(Context, () => Context.Emit(OpCodes.Mul));
  460. }
  461. public static void Fneg_S(AILEmitterCtx Context)
  462. {
  463. EmitScalarUnaryOpF(Context, () => Context.Emit(OpCodes.Neg));
  464. }
  465. public static void Fneg_V(AILEmitterCtx Context)
  466. {
  467. EmitVectorUnaryOpF(Context, () => Context.Emit(OpCodes.Neg));
  468. }
  469. public static void Fnmadd_S(AILEmitterCtx Context)
  470. {
  471. AOpCodeSimdReg Op = (AOpCodeSimdReg)Context.CurrOp;
  472. int SizeF = Op.Size & 1;
  473. EmitVectorExtractF(Context, Op.Rn, 0, SizeF);
  474. Context.Emit(OpCodes.Neg);
  475. EmitVectorExtractF(Context, Op.Rm, 0, SizeF);
  476. Context.Emit(OpCodes.Mul);
  477. EmitVectorExtractF(Context, Op.Ra, 0, SizeF);
  478. Context.Emit(OpCodes.Sub);
  479. EmitScalarSetF(Context, Op.Rd, SizeF);
  480. }
  481. public static void Fnmsub_S(AILEmitterCtx Context)
  482. {
  483. AOpCodeSimdReg Op = (AOpCodeSimdReg)Context.CurrOp;
  484. int SizeF = Op.Size & 1;
  485. EmitVectorExtractF(Context, Op.Rn, 0, SizeF);
  486. EmitVectorExtractF(Context, Op.Rm, 0, SizeF);
  487. Context.Emit(OpCodes.Mul);
  488. EmitVectorExtractF(Context, Op.Ra, 0, SizeF);
  489. Context.Emit(OpCodes.Sub);
  490. EmitScalarSetF(Context, Op.Rd, SizeF);
  491. }
  492. public static void Fnmul_S(AILEmitterCtx Context)
  493. {
  494. EmitScalarBinaryOpF(Context, () =>
  495. {
  496. Context.Emit(OpCodes.Mul);
  497. Context.Emit(OpCodes.Neg);
  498. });
  499. }
  500. public static void Frecpe_S(AILEmitterCtx Context)
  501. {
  502. EmitScalarUnaryOpF(Context, () =>
  503. {
  504. EmitUnarySoftFloatCall(Context, nameof(ASoftFloat.RecipEstimate));
  505. });
  506. }
  507. public static void Frecpe_V(AILEmitterCtx Context)
  508. {
  509. EmitVectorUnaryOpF(Context, () =>
  510. {
  511. EmitUnarySoftFloatCall(Context, nameof(ASoftFloat.RecipEstimate));
  512. });
  513. }
  514. public static void Frecps_S(AILEmitterCtx Context)
  515. {
  516. EmitScalarBinaryOpF(Context, () =>
  517. {
  518. EmitBinarySoftFloatCall(Context, nameof(ASoftFloat.RecipStep));
  519. });
  520. }
  521. public static void Frecps_V(AILEmitterCtx Context)
  522. {
  523. EmitVectorBinaryOpF(Context, () =>
  524. {
  525. EmitBinarySoftFloatCall(Context, nameof(ASoftFloat.RecipStep));
  526. });
  527. }
  528. public static void Frinta_S(AILEmitterCtx Context)
  529. {
  530. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  531. EmitVectorExtractF(Context, Op.Rn, 0, Op.Size);
  532. EmitRoundMathCall(Context, MidpointRounding.AwayFromZero);
  533. EmitScalarSetF(Context, Op.Rd, Op.Size);
  534. }
  535. public static void Frinta_V(AILEmitterCtx Context)
  536. {
  537. EmitVectorUnaryOpF(Context, () =>
  538. {
  539. EmitRoundMathCall(Context, MidpointRounding.AwayFromZero);
  540. });
  541. }
  542. public static void Frinti_S(AILEmitterCtx Context)
  543. {
  544. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  545. EmitScalarUnaryOpF(Context, () =>
  546. {
  547. Context.EmitLdarg(ATranslatedSub.StateArgIdx);
  548. Context.EmitCallPropGet(typeof(AThreadState), nameof(AThreadState.Fpcr));
  549. if (Op.Size == 0)
  550. {
  551. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.RoundF));
  552. }
  553. else if (Op.Size == 1)
  554. {
  555. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.Round));
  556. }
  557. else
  558. {
  559. throw new InvalidOperationException();
  560. }
  561. });
  562. }
  563. public static void Frinti_V(AILEmitterCtx Context)
  564. {
  565. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  566. int SizeF = Op.Size & 1;
  567. EmitVectorUnaryOpF(Context, () =>
  568. {
  569. Context.EmitLdarg(ATranslatedSub.StateArgIdx);
  570. Context.EmitCallPropGet(typeof(AThreadState), nameof(AThreadState.Fpcr));
  571. if (SizeF == 0)
  572. {
  573. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.RoundF));
  574. }
  575. else if (SizeF == 1)
  576. {
  577. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.Round));
  578. }
  579. else
  580. {
  581. throw new InvalidOperationException();
  582. }
  583. });
  584. }
  585. public static void Frintm_S(AILEmitterCtx Context)
  586. {
  587. EmitScalarUnaryOpF(Context, () =>
  588. {
  589. EmitUnaryMathCall(Context, nameof(Math.Floor));
  590. });
  591. }
  592. public static void Frintm_V(AILEmitterCtx Context)
  593. {
  594. EmitVectorUnaryOpF(Context, () =>
  595. {
  596. EmitUnaryMathCall(Context, nameof(Math.Floor));
  597. });
  598. }
  599. public static void Frintn_S(AILEmitterCtx Context)
  600. {
  601. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  602. EmitVectorExtractF(Context, Op.Rn, 0, Op.Size);
  603. EmitRoundMathCall(Context, MidpointRounding.ToEven);
  604. EmitScalarSetF(Context, Op.Rd, Op.Size);
  605. }
  606. public static void Frintn_V(AILEmitterCtx Context)
  607. {
  608. EmitVectorUnaryOpF(Context, () =>
  609. {
  610. EmitRoundMathCall(Context, MidpointRounding.ToEven);
  611. });
  612. }
  613. public static void Frintp_S(AILEmitterCtx Context)
  614. {
  615. EmitScalarUnaryOpF(Context, () =>
  616. {
  617. EmitUnaryMathCall(Context, nameof(Math.Ceiling));
  618. });
  619. }
  620. public static void Frintp_V(AILEmitterCtx Context)
  621. {
  622. EmitVectorUnaryOpF(Context, () =>
  623. {
  624. EmitUnaryMathCall(Context, nameof(Math.Ceiling));
  625. });
  626. }
  627. public static void Frintx_S(AILEmitterCtx Context)
  628. {
  629. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  630. EmitScalarUnaryOpF(Context, () =>
  631. {
  632. Context.EmitLdarg(ATranslatedSub.StateArgIdx);
  633. Context.EmitCallPropGet(typeof(AThreadState), nameof(AThreadState.Fpcr));
  634. if (Op.Size == 0)
  635. {
  636. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.RoundF));
  637. }
  638. else if (Op.Size == 1)
  639. {
  640. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.Round));
  641. }
  642. else
  643. {
  644. throw new InvalidOperationException();
  645. }
  646. });
  647. }
  648. public static void Frintx_V(AILEmitterCtx Context)
  649. {
  650. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  651. EmitVectorUnaryOpF(Context, () =>
  652. {
  653. Context.EmitLdarg(ATranslatedSub.StateArgIdx);
  654. Context.EmitCallPropGet(typeof(AThreadState), nameof(AThreadState.Fpcr));
  655. if (Op.Size == 0)
  656. {
  657. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.RoundF));
  658. }
  659. else if (Op.Size == 1)
  660. {
  661. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.Round));
  662. }
  663. else
  664. {
  665. throw new InvalidOperationException();
  666. }
  667. });
  668. }
  669. public static void Frsqrte_S(AILEmitterCtx Context)
  670. {
  671. EmitScalarUnaryOpF(Context, () =>
  672. {
  673. EmitUnarySoftFloatCall(Context, nameof(ASoftFloat.InvSqrtEstimate));
  674. });
  675. }
  676. public static void Frsqrte_V(AILEmitterCtx Context)
  677. {
  678. EmitVectorUnaryOpF(Context, () =>
  679. {
  680. EmitUnarySoftFloatCall(Context, nameof(ASoftFloat.InvSqrtEstimate));
  681. });
  682. }
  683. public static void Frsqrts_S(AILEmitterCtx Context)
  684. {
  685. EmitFrsqrts(Context, 0, Scalar: true);
  686. }
  687. public static void Frsqrts_V(AILEmitterCtx Context)
  688. {
  689. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  690. int SizeF = Op.Size & 1;
  691. int Bytes = Context.CurrOp.GetBitsCount() >> 3;
  692. for (int Index = 0; Index < Bytes >> SizeF + 2; Index++)
  693. {
  694. EmitFrsqrts(Context, Index, Scalar: false);
  695. }
  696. if (Op.RegisterSize == ARegisterSize.SIMD64)
  697. {
  698. EmitVectorZeroUpper(Context, Op.Rd);
  699. }
  700. }
  701. private static void EmitFrsqrts(AILEmitterCtx Context, int Index, bool Scalar)
  702. {
  703. AOpCodeSimdReg Op = (AOpCodeSimdReg)Context.CurrOp;
  704. int SizeF = Op.Size & 1;
  705. if (SizeF == 0)
  706. {
  707. Context.EmitLdc_R4(3);
  708. }
  709. else /* if (SizeF == 1) */
  710. {
  711. Context.EmitLdc_R8(3);
  712. }
  713. EmitVectorExtractF(Context, Op.Rn, Index, SizeF);
  714. EmitVectorExtractF(Context, Op.Rm, Index, SizeF);
  715. Context.Emit(OpCodes.Mul);
  716. Context.Emit(OpCodes.Sub);
  717. if (SizeF == 0)
  718. {
  719. Context.EmitLdc_R4(0.5f);
  720. }
  721. else /* if (SizeF == 1) */
  722. {
  723. Context.EmitLdc_R8(0.5);
  724. }
  725. Context.Emit(OpCodes.Mul);
  726. if (Scalar)
  727. {
  728. EmitVectorZeroAll(Context, Op.Rd);
  729. }
  730. EmitVectorInsertF(Context, Op.Rd, Index, SizeF);
  731. }
  732. public static void Fsqrt_S(AILEmitterCtx Context)
  733. {
  734. EmitScalarUnaryOpF(Context, () =>
  735. {
  736. EmitUnaryMathCall(Context, nameof(Math.Sqrt));
  737. });
  738. }
  739. public static void Fsub_S(AILEmitterCtx Context)
  740. {
  741. if (AOptimizations.UseSse && AOptimizations.UseSse2)
  742. {
  743. EmitSseOrSse2CallF(Context, nameof(Sse.SubtractScalar));
  744. }
  745. else
  746. {
  747. EmitScalarBinaryOpF(Context, () => Context.Emit(OpCodes.Sub));
  748. }
  749. }
  750. public static void Fsub_V(AILEmitterCtx Context)
  751. {
  752. if (AOptimizations.UseSse && AOptimizations.UseSse2)
  753. {
  754. EmitSseOrSse2CallF(Context, nameof(Sse.Subtract));
  755. }
  756. else
  757. {
  758. EmitVectorBinaryOpF(Context, () => Context.Emit(OpCodes.Sub));
  759. }
  760. }
  761. public static void Mla_V(AILEmitterCtx Context)
  762. {
  763. EmitVectorTernaryOpZx(Context, () =>
  764. {
  765. Context.Emit(OpCodes.Mul);
  766. Context.Emit(OpCodes.Add);
  767. });
  768. }
  769. public static void Mla_Ve(AILEmitterCtx Context)
  770. {
  771. EmitVectorTernaryOpByElemZx(Context, () =>
  772. {
  773. Context.Emit(OpCodes.Mul);
  774. Context.Emit(OpCodes.Add);
  775. });
  776. }
  777. public static void Mls_V(AILEmitterCtx Context)
  778. {
  779. EmitVectorTernaryOpZx(Context, () =>
  780. {
  781. Context.Emit(OpCodes.Mul);
  782. Context.Emit(OpCodes.Sub);
  783. });
  784. }
  785. public static void Mul_V(AILEmitterCtx Context)
  786. {
  787. EmitVectorBinaryOpZx(Context, () => Context.Emit(OpCodes.Mul));
  788. }
  789. public static void Mul_Ve(AILEmitterCtx Context)
  790. {
  791. EmitVectorBinaryOpByElemZx(Context, () => Context.Emit(OpCodes.Mul));
  792. }
  793. public static void Neg_S(AILEmitterCtx Context)
  794. {
  795. EmitScalarUnaryOpSx(Context, () => Context.Emit(OpCodes.Neg));
  796. }
  797. public static void Neg_V(AILEmitterCtx Context)
  798. {
  799. EmitVectorUnaryOpSx(Context, () => Context.Emit(OpCodes.Neg));
  800. }
  801. public static void Raddhn_V(AILEmitterCtx Context)
  802. {
  803. EmitHighNarrow(Context, () => Context.Emit(OpCodes.Add), Round: true);
  804. }
  805. public static void Rsubhn_V(AILEmitterCtx Context)
  806. {
  807. EmitHighNarrow(Context, () => Context.Emit(OpCodes.Sub), Round: true);
  808. }
  809. public static void Saba_V(AILEmitterCtx Context)
  810. {
  811. EmitVectorTernaryOpSx(Context, () =>
  812. {
  813. Context.Emit(OpCodes.Sub);
  814. EmitAbs(Context);
  815. Context.Emit(OpCodes.Add);
  816. });
  817. }
  818. public static void Sabal_V(AILEmitterCtx Context)
  819. {
  820. EmitVectorWidenRnRmTernaryOpSx(Context, () =>
  821. {
  822. Context.Emit(OpCodes.Sub);
  823. EmitAbs(Context);
  824. Context.Emit(OpCodes.Add);
  825. });
  826. }
  827. public static void Sabd_V(AILEmitterCtx Context)
  828. {
  829. EmitVectorBinaryOpSx(Context, () =>
  830. {
  831. Context.Emit(OpCodes.Sub);
  832. EmitAbs(Context);
  833. });
  834. }
  835. public static void Sabdl_V(AILEmitterCtx Context)
  836. {
  837. EmitVectorWidenRnRmBinaryOpSx(Context, () =>
  838. {
  839. Context.Emit(OpCodes.Sub);
  840. EmitAbs(Context);
  841. });
  842. }
  843. public static void Saddw_V(AILEmitterCtx Context)
  844. {
  845. EmitVectorWidenRmBinaryOpSx(Context, () => Context.Emit(OpCodes.Add));
  846. }
  847. public static void Smax_V(AILEmitterCtx Context)
  848. {
  849. Type[] Types = new Type[] { typeof(long), typeof(long) };
  850. MethodInfo MthdInfo = typeof(Math).GetMethod(nameof(Math.Max), Types);
  851. EmitVectorBinaryOpSx(Context, () => Context.EmitCall(MthdInfo));
  852. }
  853. public static void Smaxp_V(AILEmitterCtx Context)
  854. {
  855. Type[] Types = new Type[] { typeof(long), typeof(long) };
  856. MethodInfo MthdInfo = typeof(Math).GetMethod(nameof(Math.Max), Types);
  857. EmitVectorPairwiseOpSx(Context, () => Context.EmitCall(MthdInfo));
  858. }
  859. public static void Smin_V(AILEmitterCtx Context)
  860. {
  861. Type[] Types = new Type[] { typeof(long), typeof(long) };
  862. MethodInfo MthdInfo = typeof(Math).GetMethod(nameof(Math.Min), Types);
  863. EmitVectorBinaryOpSx(Context, () => Context.EmitCall(MthdInfo));
  864. }
  865. public static void Sminp_V(AILEmitterCtx Context)
  866. {
  867. Type[] Types = new Type[] { typeof(long), typeof(long) };
  868. MethodInfo MthdInfo = typeof(Math).GetMethod(nameof(Math.Min), Types);
  869. EmitVectorPairwiseOpSx(Context, () => Context.EmitCall(MthdInfo));
  870. }
  871. public static void Smlal_V(AILEmitterCtx Context)
  872. {
  873. EmitVectorWidenRnRmTernaryOpSx(Context, () =>
  874. {
  875. Context.Emit(OpCodes.Mul);
  876. Context.Emit(OpCodes.Add);
  877. });
  878. }
  879. public static void Smull_V(AILEmitterCtx Context)
  880. {
  881. EmitVectorWidenRnRmBinaryOpSx(Context, () => Context.Emit(OpCodes.Mul));
  882. }
  883. public static void Sqxtn_S(AILEmitterCtx Context)
  884. {
  885. EmitSaturatingExtNarrow(Context, SignedSrc: true, SignedDst: true, Scalar: true);
  886. }
  887. public static void Sqxtn_V(AILEmitterCtx Context)
  888. {
  889. EmitSaturatingExtNarrow(Context, SignedSrc: true, SignedDst: true, Scalar: false);
  890. }
  891. public static void Sqxtun_S(AILEmitterCtx Context)
  892. {
  893. EmitSaturatingExtNarrow(Context, SignedSrc: true, SignedDst: false, Scalar: true);
  894. }
  895. public static void Sqxtun_V(AILEmitterCtx Context)
  896. {
  897. EmitSaturatingExtNarrow(Context, SignedSrc: true, SignedDst: false, Scalar: false);
  898. }
  899. public static void Sub_S(AILEmitterCtx Context)
  900. {
  901. EmitScalarBinaryOpZx(Context, () => Context.Emit(OpCodes.Sub));
  902. }
  903. public static void Sub_V(AILEmitterCtx Context)
  904. {
  905. if (AOptimizations.UseSse2)
  906. {
  907. EmitSse2Call(Context, nameof(Sse2.Subtract));
  908. }
  909. else
  910. {
  911. EmitVectorBinaryOpZx(Context, () => Context.Emit(OpCodes.Sub));
  912. }
  913. }
  914. public static void Subhn_V(AILEmitterCtx Context)
  915. {
  916. EmitHighNarrow(Context, () => Context.Emit(OpCodes.Sub), Round: false);
  917. }
  918. public static void Uaba_V(AILEmitterCtx Context)
  919. {
  920. EmitVectorTernaryOpZx(Context, () =>
  921. {
  922. Context.Emit(OpCodes.Sub);
  923. EmitAbs(Context);
  924. Context.Emit(OpCodes.Add);
  925. });
  926. }
  927. public static void Uabal_V(AILEmitterCtx Context)
  928. {
  929. EmitVectorWidenRnRmTernaryOpZx(Context, () =>
  930. {
  931. Context.Emit(OpCodes.Sub);
  932. EmitAbs(Context);
  933. Context.Emit(OpCodes.Add);
  934. });
  935. }
  936. public static void Uabd_V(AILEmitterCtx Context)
  937. {
  938. EmitVectorBinaryOpZx(Context, () =>
  939. {
  940. Context.Emit(OpCodes.Sub);
  941. EmitAbs(Context);
  942. });
  943. }
  944. public static void Uabdl_V(AILEmitterCtx Context)
  945. {
  946. EmitVectorWidenRnRmBinaryOpZx(Context, () =>
  947. {
  948. Context.Emit(OpCodes.Sub);
  949. EmitAbs(Context);
  950. });
  951. }
  952. public static void Uaddl_V(AILEmitterCtx Context)
  953. {
  954. EmitVectorWidenRnRmBinaryOpZx(Context, () => Context.Emit(OpCodes.Add));
  955. }
  956. public static void Uaddlv_V(AILEmitterCtx Context)
  957. {
  958. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  959. int Bytes = Context.CurrOp.GetBitsCount() >> 3;
  960. EmitVectorExtractZx(Context, Op.Rn, 0, Op.Size);
  961. for (int Index = 1; Index < (Bytes >> Op.Size); Index++)
  962. {
  963. EmitVectorExtractZx(Context, Op.Rn, Index, Op.Size);
  964. Context.Emit(OpCodes.Add);
  965. }
  966. EmitScalarSet(Context, Op.Rd, Op.Size + 1);
  967. }
  968. public static void Uaddw_V(AILEmitterCtx Context)
  969. {
  970. EmitVectorWidenRmBinaryOpZx(Context, () => Context.Emit(OpCodes.Add));
  971. }
  972. public static void Uhadd_V(AILEmitterCtx Context)
  973. {
  974. EmitVectorBinaryOpZx(Context, () =>
  975. {
  976. Context.Emit(OpCodes.Add);
  977. Context.EmitLdc_I4(1);
  978. Context.Emit(OpCodes.Shr_Un);
  979. });
  980. }
  981. public static void Umin_V(AILEmitterCtx Context)
  982. {
  983. Type[] Types = new Type[] { typeof(ulong), typeof(ulong) };
  984. MethodInfo MthdInfo = typeof(Math).GetMethod(nameof(Math.Min), Types);
  985. EmitVectorBinaryOpZx(Context, () => Context.EmitCall(MthdInfo));
  986. }
  987. public static void Uminp_V(AILEmitterCtx Context)
  988. {
  989. Type[] Types = new Type[] { typeof(ulong), typeof(ulong) };
  990. MethodInfo MthdInfo = typeof(Math).GetMethod(nameof(Math.Min), Types);
  991. EmitVectorPairwiseOpZx(Context, () => Context.EmitCall(MthdInfo));
  992. }
  993. public static void Umax_V(AILEmitterCtx Context)
  994. {
  995. Type[] Types = new Type[] { typeof(ulong), typeof(ulong) };
  996. MethodInfo MthdInfo = typeof(Math).GetMethod(nameof(Math.Max), Types);
  997. EmitVectorBinaryOpZx(Context, () => Context.EmitCall(MthdInfo));
  998. }
  999. public static void Umaxp_V(AILEmitterCtx Context)
  1000. {
  1001. Type[] Types = new Type[] { typeof(ulong), typeof(ulong) };
  1002. MethodInfo MthdInfo = typeof(Math).GetMethod(nameof(Math.Max), Types);
  1003. EmitVectorPairwiseOpZx(Context, () => Context.EmitCall(MthdInfo));
  1004. }
  1005. public static void Umull_V(AILEmitterCtx Context)
  1006. {
  1007. EmitVectorWidenRnRmBinaryOpZx(Context, () => Context.Emit(OpCodes.Mul));
  1008. }
  1009. public static void Uqxtn_S(AILEmitterCtx Context)
  1010. {
  1011. EmitSaturatingExtNarrow(Context, SignedSrc: false, SignedDst: false, Scalar: true);
  1012. }
  1013. public static void Uqxtn_V(AILEmitterCtx Context)
  1014. {
  1015. EmitSaturatingExtNarrow(Context, SignedSrc: false, SignedDst: false, Scalar: false);
  1016. }
  1017. }
  1018. }